S10 TES的八强赛,创造了奇迹,看看比赛时网友们怎么说的
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
我相信很多观众会和我一样吧,当TES赢下第一局后开始心怀侥幸,赢下第二局后觉得有了有了,当赢下第三局后,对嘛这才是TES。
从未有支战队在S赛8进4完成让二追三,但TES他们做到了,创造了奇迹。
恭喜TES顺利进入4强,也希望之后的比赛继续带给我们精彩的对决!
本次目标
爬取B站弹幕,并词云显示
目标地址
https://www.bilibili.com/video/BV1zA41177FQ?spm_id_from=333.851.b_7265706f7274466972737433.2
开发工具
- python 3.6.5
- pycharm
爬虫代码
导入工具
import requests import re
安装相关的库即可
完整代码
for page in range(17, 20): url = 'https://api.bilibili.com/x/v2/dm/history?type=1&oid=246648707&date=2020-10-{}'.format(page) headers = { 'cookie': '_uuid=50D22ECF-208D-9409-DEA1-0B3EA3F74AB793744infoc; buvid3=A0FE83C2-5981-40DC-B0E2-C74A37227ECF155818infoc; rpdid=|(umuummlkY~0J\'ulm|ullmll; sid=kr4i59d5; LIVE_BUVID=AUTO3215909029132687; blackside_state=1; CURRENT_FNVAL=80; DedeUserID=406732493; DedeUserID__ckMd5=48c43aca436bb747; SESSDATA=204f478b%2C1615703177%2C53385*91; bili_jct=08d11cd34efbf3da0d2138d562145e5c; PVID=1; dy_spec_agreed=1; bsource=search_baidu; bfe_id=6f285c892d9d3c1f8f020adad8bed553; bp_video_offset_406732493=446718397413729260; bp_t_offset_406732493=447756572613788019', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) response.encoding = response.apparent_encoding lis = re.findall('<d p=".*?">(.*?)</d>', response.text, re.S) for i in lis: with open('八强赛弹幕.txt', mode='a', encoding='utf-8') as f: f.write(i) f.write('\n') print(i)
运行代码,效果如下图
现在有数据了可以开始动手做词云了
词云代码
导入工具
import jieba import wordcloud import imageio
完整代码
py = imageio.imread(r"图片地址") # 读取文件内容 f = open(r'弹幕数据地址', encoding='utf-8') txt = f.read() # print(txt) # jiabe 分词 分割词汇 txt_list = jieba.lcut(txt) string = ' '.join(txt_list) # 词云图设置 wc = wordcloud.WordCloud( width=1000, # 图片的宽 height=700, # 图片的高 background_color='white', # 图片背景颜色 font_path='msyh.ttc', # 词云字体 mask=py, # 所使用的词云图片 scale=15, stopwords={'真的', '这个'}, # contour_width=5, # contour_color='red' # 轮廓颜色 ) # 给词云输入文字 wc.generate(string) wc.to_file(r'保存图片地址')
运行代码