obmem.info
域名年龄: 13年7个月29天HTTP/1.1 200 OK 服务器:nginx/1.2.6 (Ubuntu) 访问时间:2014年01月30日 12:34:02 类型:text/html; charset=UTF-8 Transfer-Encoding: chunked 连接:keep-alive 语言环境:PHP/5.4.9-4ubuntu2.2 X-Pingback: http://obmem.info/xmlrpc.php Content-Encoding: gzip 网站编码:UTF-8
observer专栏杂记建站 编程 杂记Skip to contentHomePythonPhpAboutDonatiton← Older posts如何破解新浪微博的验证码Posted on June 23, 2013 by observer最近要为公司做一系列微博的东东,有些API微博不公开提供,于是断断续续开发了一个叫libweibo的库,专门用来做坏事,嘿嘿。其中最核心的部分就是三种不同微博验证码的破解了,按强度递减分别为新浪SSO统一登录验证码、私信验证码、以及搜索验证码。大体的方法还是我以前提到的python 验证码破解的方法,不过多年后,python又多了好多好用的库,比如sklearn这个大杀器,所以把一些通用概念再次总结一下,另外尝试了一下reveal.js做了个在线的slide。分享如下:)http://slid.es/jingchaohu/decoding-weibo-captcha-in-pythonPosted in python, 编程|7 Comments使用python/casperjs编写终极爬虫-客户端App的抓取Posted on September 29, 2012 by observer1.缘起随着移动互联网的发展,现在写web和我三年前刚开始写爬虫的时候已经改变了太多。特别是在node以及javascript/ruby社区的努力下,以往“服务器端”做的事情都慢慢搬到了“浏览器”来实现,最极端的例子可能是meteor了 ,写web程序无需划分前端后端的时代已经到来了。。。在这一方面,Google一向是最激进的。纵观Google目前的产品线,社交的Google Plus,网站分析的Google Analytics,Google目前赖以生存的Google Adwords等,如果想下载源码,用ElementTree来解析网页,那什么都得不到,因为Google的数据都是通过Ajax调用经过数据混淆处理的数据,然后用JavaScript进行解析渲染到页面上的。本来这种事情也不算太多,忍一忍就行了,不过最近因业务需要,经常需要上Google的Keyword Tools来分析特定关键字的搜索量图为关键字搜索的截图Continue reading →Posted in python, 编程|Tagged casperjs, Google Keyword Tools, javascript, python, scraper, selenium|15 Comments网站广告投放策略研究 (一) 轮播以及效用最大化Posted on January 31, 2011 by observer首先科普一下目前互联网广告的类型,大体都有CPC,CPM,CPA,CPS,CPV这几种。CPC就是按点击(Click)计算,CPM就是按弹窗(Mxxx?)计算,CPA/CPS一个是按注册一个是按销售计算,CPV则是按显示次数计算。于是CPC,CPA,CPS这种根据网站访客行为来获得收益的是一类,而CPM和CPV这种只和网站流量相关的则是另一类。可想而知,CPC,CPA,CPS的效果要分析访客群体,点击习惯等诸多要素来进行调整,非一蹴而就,这篇文章中我主要想研究怎么从流量上做文章,在不作弊的情况下获取尽可能多的收益;等广告联盟用得多了,时间长了,也会给一点不同广告联盟的评价。本文地址 http://obmem.info/?p=844 ,转载请保留,谢谢。Continue reading →Posted in 站长, 编程|Tagged javascript, 广告, 站长, 编程|44 Comments防DDoS脚本 in pythonPosted on January 23, 2011 by observer这篇博可以说连开场白都可以省掉了,之所以被DDoS,并不是因为惹了疯狗被追着咬,而是因为VC悲剧之后流量全到simplecd来了。不仅如此,一些笨蛋们在抓站,一些笨蛋们在用迅雷下载,100Mbps的端口居然已经满负荷运作十几个小时了,这是什么概念?100Mbps满负荷1天,流量就是1000G,这样下去不用多久,我就可以等着上百刀的罚单了,泪飙。此外,100Mbps的速度使得硬盘都快转不动了,严重拖累网站的响应速度,卡得我欲仙欲死啊真是。想当年VC挂了一天,被抓站的家伙们搞得一个礼拜半残废状态(其中那些家伙包括我在内,汗)。simplecd就更支撑不了了。Continue reading →Posted in Linux, python, 站长, 编程|Tagged Linux, python, 站长, 编程|110 Comments网站流量上去了,但是完全高兴不起来啊Posted on January 23, 2011 by observer晚上在simplecd上搜某音乐时就觉得不对劲,5分钟热度值也太高了点,登陆51.la看了以后真是吓了一跳,15分钟在线从平时的200-300+跳到了1000+,绝对有啥事情发生了。经过浏览流量来源,果然不出所料有状况:VC发神经把音乐给砍了。根据一些搜索和尝试,是先砍专栏,再砍搜索,然后逐条删敏感数据的砍法,到时候也不知道会有多少资源幸存。Continue reading →Posted in 其他|Tagged VeryCD|93 CommentsMacBook翻/墙术Posted on January 20, 2011 by observer因为退税原因,入手同学的MacBookPro一台期限一月,虽然没有网络,但最近也着实蛮哈皮的,用着颇爽,虽然开发上来讲用着还是没Ubuntu顺手,尤其那MacPort,简直就一Gentoo么。帮同学写MBP使用攻略的时候,顺手写一下Mac翻/墙攻略,于是就有了本文Continue reading →Posted in 翻墙|Tagged 翻墙|26 Comments共享理财的一些实践(纯理论向IT向)Posted on December 27, 2010 by observer共享理财是指多人之间夹杂不清的财务关系状态下的理财方法。实际上这是我在和别人合租的情况下,出于减少工作量的懒人思维而折腾出来的东东。因为刚搬家,很长一段时间内都没有网络,无聊之极;再加上一直管帐的女生觉得算钱太累,把皮球踢到我的身上,所以干脆开始研究省心省力的理财方法。于是就有了本文。本文对于某些人来说可能极度无聊,慎入。Continue reading →Posted in python, 其他, 编程|Tagged python, 其他, 编程|41 Comments一年米国VPS使用经验总结Posted on December 11, 2010 by observer估计以后也很少会再用VPS,整理一下我用过的所有VPS吧。申明:所有网速评价都是基于米国-米国(apt-get)、米国-澳洲(filezilla下载,VPN)的网速,到国内的网速我没有条件测试。按时间顺序来:1.mediatemple dv base: 50刀,20G硬盘,512M内存,
© 2010 - 2020 网站综合信息查询 同IP网站查询 相关类似网站查询 网站备案查询网站地图 最新查询 最近更新 优秀网站 热门网站 全部网站 同IP查询 备案查询
2024-04-29 09:33, Process in 0.0056 second.