篼雨的博客主要更新一些Python非常Easy的小脚本,让初学者先了解一下思路,比如这次涉及到的小脚本翻页的问题,其实用for遍历一下就OK,虽然爱站只提供了50页,但对一些小站长来说也已经足够了,如果像途牛,赶集这种级别的网站,那就只能看很小一部分的排名数据了,看排名数据有什么用呢?很多,比如看看主题有木有漂移,预估查看着陆页(当然有很多更好的工具),哪些关键词没覆盖到,具体排名位置等等,篼雨思维比较有限,还有自己想吧,还是上代码:
运行结果:
代码如下,用Wp-syntax这个插件没法放,复制咩用,自行敲代码,记得看上图的缩进,还有不要中文状态下输入标点符号!主要放下正则表达式那块内容:
datas=re.findall('<a rel="nofollow" target="_blank" href="https://www\.baidu\.com/s\?wd=.*?">(.*?)</a>[\s\S]*?<span class="pos">(\d+)</span>[\s\S]*?class="zhishu" href=".*?">(\d+)</a>[\s\S]*?<td align="right">(\d+)</td>[\s\S]*?<td align="right">(\d+)</td>[\s\S]*?<a rel="nofollow" target="_blank" href=".*?">(\d+)</a>',html)
好了,作为一个Python爱好者,你看了没?感谢关注篼雨的博客,欢迎转载,但请勿恶心!