利用爬虫工具爬取虎牙直播数据

打开虎牙https://www.huya.com/l按下F12了解网站基本信息,思考一下所要抓取的内容

选中network刷新一下页面找到一个page=的链接我这里抓取的是第三页的数据所以等号后面为page=3

https://www.huya.com/cache.php?m=LiveList&do=getLiveListByPage&tagAll=0&page=3

点击一下上图那个蓝色区域就会出现上面这个链接,这个就是要抓取数据的网址如下图所示

 

 

有了思路之后就开始进行数据抓取

先导入所需要的包

然后创建一个链接和伪装头

利用requests库创建个get请求,再用json解析

下面开始抓取自己需要数据

抓取数据要先进一个大标签data然后在逐步

利用for循环开始抓取需要的内容如下图所示

 

之后运行即可,为拉防止ip被禁我们给它设置一个停留时间

然后运行即可(下图所示)

 

版权声明:本文为hejingzi原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/hejingzi/p/14093918.html