爬虫

爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。

Python爬取百度热榜 Python爬取百度热榜 这是一个非常基础的爬虫;使用Python爬取百度热榜的标题和链接;
配置Nginx实现屏蔽爬虫IP 防止爬虫采集绝对是一个站长需要做的事;且不说站内资源被爬走,单是爬虫采集时消耗的服务器资源可能就够很多站长心疼了。
Python爬取国外可用的代理IP 这是作者曾经在某个程序中写的一个python模块,其作用是爬取国外的一个免费代理IP网站,获得免费的代理IP。