12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?_朝阳网站建设_网站建设公司_网站建设设计制作_seo优化
新鲜 / 健康 / 便利 / 快速 / 放心
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
上一篇 : 雷军为什么不愿意用性价比打法进军NAS?
下一篇 : 怎样才能把动态磁盘转换为基本磁盘?