晒美胸图片站开发过程

上周四花了整整一个下午扒了牧风同学的iphoto主题,直接复制了牧风开源的主题中图片和样式表目录,然后用firebug手动扒的HTML结构。瀑布流用的jquery.masonry而没有直接扒牧风同学的jquery.waterwall「因为牧风同学的js简单混淆了,重新梳理一遍的时间足够我写个简单的瀑布流了」。再用了不到一个小时简单写了一个根据关键词抓取渣浪微博图片的小代码:入库、分页显示、瀑布流。简陋的甚至连一个后台都没有。把抓取图片的URL直接扔给uptimerobot监控起来,这样就可以实现自动抓取图片自动入库了。赶在下班前简单的部署在了SAE上,周五开始就放假休端午节。周六才有时间上网看了一下,发现uptimerobot报了一些5xx错误,但数据也自动抓了几百条。简单暴力的try:except屏蔽掉了异常,然后打包放在了hostloc上下载。周日晚上回京在电脑上才发现有几十人下载,但...

精彩继续

libxml是个好东西

做网址缩短这个小东西时候没有使用BeautifulSoup而是用了libxml来解析HTML获取页面title等。因为平时上班所以业余时间不是很充足,所以毕业后俺已经好几年没玩过大型的网游或者其他需要消耗很长时间的游戏了。差不多一年前吧,俺有次生病在家偶尔玩了一个QQ平台上的wap页游,中间因为不需要太长的连续的时间,所以也就断断续续没有停。虽然这个游戏很垃圾「各种开箱子,不过俺秉着不给腾讯花任何一毛钱的底限,箱子能免费开的就开开,不免费的就算球」。几个月前用python写了一个简单的外挂,用来操作一些重复性劳动的小操作。中间抓取到页面内容解析直接使用了正则,但发现效率并不是很好,而且改用多线程后就频繁被「超时」。正好公司电脑上曾经安装了libxml,就花了一个小时重写了一下那个简单外挂。不得不吐槽下libxml,文档呢?虽然代码很少主要的也就20多K,翻着看一遍也没多久,但您为啥不留个文...

精彩继续

博客迁移到免费的SAE平台

现在VPS中的站点越来越多的使用Python,php的东西差不多都已经被迁移走了,这个博客使用的Typecho,完整用python重写工作量比较大,渣浪的SAE很早就已经支持Typecho,所以想迁移到SAE平台,好为VPS挪出点资源。SAE安装Typecho直接通过面板安装即可,但伪静态需要自己上传一个「.htaccess」,这里需要吐槽下坑爹的SAE,周六时候安装的Typecho,但SVN一直无法访问,提交工单后明明够选了解决后Email通知俺,结果一直没见到任何的Email。周日一天也没解决,周一上班后没多久偷偷摸摸就好了……通过SVNcheckout代码下来,从VPS中的备份拿下主题和插件,备份数据库通过SAE的phpmyadmin恢复,然后没有才用SAE默认的绑米方式(SAE无备案绑米是通过ec2反代来实现的,但据说经常502),而是依然通过俺自己搭建的反代VPS来自己反代SAE...

精彩继续