大家好,我是辰哥~

今天辰哥带大家分析一波当前热门手游《王者荣耀》英雄皮肤,比如皮肤上线时间皮肤类型(勇者;史诗;传说等)、价格

数据来源于《王者荣耀官方网站》,网页数据如下:

所需内容

  1. 英雄名称

  2. 英雄皮肤名称

  3. 上线时间

  4. 皮肤类型(勇者;史诗;传说等)

  5. 价格(这个在官方没有获取到,是辰哥这边手动统计的)

首先通过查看network分析获取所有皮肤的数据(通过分析发现是异步加载的)

查看响应数据

  1. url = "https://pvp.qq.com/zlkdatasys/data_zlk_xpflby.json"
  2. response = requests.get(url).json()
  3. for i in response[\'pcblzlby_c6\']:
  4. print(i[\'pcblzlbybt_d3\'],i[\'lbyrq_e5\'],i[\'pcblzlbyxqydz_c4\'])

这里只获取到英雄皮肤名称、上线时间以及皮肤详细信息链接(包含皮肤类型、对应英雄)

这里只获取到了189款皮肤(9*21=189),接着在继续通过异步请求获得的皮肤详细信息链接,去获取皮肤的具体信息。

以其中一个皮肤为例

可以获取到皮肤类型(传说);皮肤名称(仲夏夜之梦);对应英雄(貂蝉);

通过查看源代码可以发现所需内容对应的网页标签,其中皮肤类型是图片的形式展示,但是我们需要的是文字内容,但是也不并非无规律可寻

皮肤类型规律:

勇者:1.png

限定:5.png

史诗:12.png

传说:15.png

KPL限定:19.png

情人节限定:24.png

荣耀典藏:26.png

FMVP:38.png

战令限定:40.png

其他:剩下的就归类到其他类(赛季限定等等)

上面的规律是皮肤类型图片对应的文字内容。

  1. url = "https:"+"//pvp.qq.com/coming/v2/skins/141-5.shtml"
  2. response = requests.get(url)
  3. response.encoding = \'gbk\'
  4. text = response.text
  5. selector = etree.HTML(text)
  6. img = selector.xpath(\'//*[@id="showSkin"]/div/img/@src\')[0]
  7. print(frompic_gettext(img))
  8. skin = selector.xpath(\'//*[@id="showSkin"]/div/div[2]/span[1]/text()\')[0]
  9. print(skin)
  10. hero = selector.xpath(\'//*[@id="showSkin"]/div/div[2]/span[2]/text()\')[0]
  11. print(hero)
  12. text = selector.xpath(\'//*[@id="showSkin"]/div/p/text()\')[0]
  13. print(text)

最终获取全部(189)的皮肤信息

  1. url = "https://pvp.qq.com/zlkdatasys/data_zlk_xpflby.json"
  2. response = requests.get(url).json()
  3. for i in response[\'pcblzlby_c6\']:
  4. types,skin,hero,text = getdetail(str(i[\'pcblzlbyxqydz_c4\']))
  5. print(hero,skin,i[\'lbyrq_e5\'],types,text)

输出结果:

最后将数据保存到excel,并手动统计皮肤对应的价格

在点券这列:

1.有具体点券信息的就直接统计(不包含首周优惠)

2.赛季专属的用0表示(免费获得)

3.战令限定的默认388(购买战令进阶)

4.其他一些抽奖,夺宝的直接用对应文字统计。

在皮肤类型这里也清洗了一下(比如五五开黑节,牛年限定等等)

先来给口号字段做一下词云图

这里直接使用辰哥的可视化平台进行制作

(show.chenlove.cn)

以下的可视化图表都直接在上面的平台一键生成

上传前面的excel文件,

选择口号字段和词云图背景;

点击生成词云图

点击导出,下载到本地

同样一键给皮肤字段做一下词云图

上线时间分析

统计每年发布的皮肤数量

  1. df = pd.read_excel("王者荣耀英雄皮肤.xlsx")
  2. time = df["上线时间"].tolist()
  3. clear_time = [str(i)[0:4] for i in time]
  4. result = Counter(clear_time)
  5. # 排序
  6. d = sorted(result.items(), key=lambda x: x[1], reverse=True)
  7. t = [i[0] for i in d]
  8. v = [i[1] for i in d]
  9. """
  10. [\'2020\', \'2019\', \'2021\', \'2018\', \'2017\']
  11. [47, 44, 43, 42, 14]
  12. """

同样的还是使用辰哥的可视化平台(选择饼图)

对结果进行可视化

可以看出从2017~2021上线皮肤数量逐年增加,由于2021年刚过一半,所以还未超过2020年的数量。

分析每年几月皮肤数量最多

统计2017~2021年皮肤数量最多的月份

  1. for j in [str(i)[0:6] for i in time]:
  2. if "2017" in str(j):
  3. t_2017.append(j[4:6])
  4. if "2018" in str(j):
  5. t_2018.append(j[4:6])
  6. if "2019" in str(j):
  7. t_2019.append(j[4:6])
  8. if "2020" in str(j):
  9. t_2020.append(j[4:6])
  10. if "2021" in str(j):
  11. t_2021.append(j[4:6])
  12. # 排序
  13. d_2017 = sorted(Counter(t_2017).items(), key=lambda x: x[1], reverse=True)
  14. d_2018 = sorted(Counter(t_2018).items(), key=lambda x: x[1], reverse=True)
  15. d_2019 = sorted(Counter(t_2019).items(), key=lambda x: x[1], reverse=True)
  16. d_2020 = sorted(Counter(t_2020).items(), key=lambda x: x[1], reverse=True)
  17. d_2021 = sorted(Counter(t_2021).items(), key=lambda x: x[1], reverse=True)
  18. print("2017",d_2017[0])
  19. print("2018",d_2018[0])
  20. print("2019",d_2019[0])
  21. print("2020",d_2020[0])
  22. print("2021",d_2021[0])
  23. """
  24. 2017 (\'10\', 3)
  25. 2018 (\'10\', 6)
  26. 2019 (\'02\', 10)
  27. 2020 (\'01\', 14)
  28. 2021 (\'02\', 10)
  29. """

可以看到在2017和2018年10月上线皮肤较多,从19年开始,过年时当月上线的皮肤数量比同年其他月份数量多。

不同点券价格

统计excel中点券一列中包含几种价格,并进行排序

  1. price = df["点券"].tolist()
  2. clear_price = [str(i) for i in price]
  3. result = Counter(clear_price)
  4. # 排序
  5. d = sorted(result.items(), key=lambda x: x[1], reverse=True)
  6. t = [i[0] for i in d]
  7. v = [i[1] for i in d]
  8. """
  9. [\'888\', \'1788\', \'0\', \'388\', \'1688\', \'60\', \'夺宝\', \'488\', \'抽奖\', \'贵族限定\', \'660\']
  10. [52, 30, 28, 21, 19, 17, 13, 6, 2, 1, 1]
  11. """

将结果导入可视化平台,生成可视化图

其中第三个是0,因为赛季皮肤可以免费获取(所需点券为0),以上就是《王者荣耀》获得皮肤的几种价格,像夺宝抽奖这种靠运气,无法去衡量点券,所以就直接展示中文意思。

几种不同皮肤类型

统计excel中类型字段,并排序

  1. """
  2. [\'史诗\', \'勇者\', \'限定\', \'战令限定\', \'其他\', \'赛季限定\', \'KPL限定\',
  3. \'FMVP\', \'荣耀典藏\', \'情人节限定\', \'鼠年限定\', \'猪年限定\', \'牛年限定\',
  4. \'五五开黑节\', \'传说\', \'狗年限定\', \'五周年限定\', \'四周年限定\', \'三周年限定\', \'战队赛专属\', \'二周年限定\']
  5. [27, 27, 26, 21, 20, 18, 9, 6, 6, 5, 5, 5, 4, 2, 2, 2, 1, 1, 1, 1, 1]
  6. """0

当前统计到是20种类型,但远不止20,因为对于“其他”标签的还包含多种,因此皮肤类型起码20+,估计20多种。此外还可以看出史诗和勇者这两个类型的皮肤是较多的。

‍‍‍‍‍‍‍‍‍‍‍

同一种点券对应不同皮肤类型

同一种点券价格对应多种皮肤类型

比如888点券对应【\’限定\’, \’史诗\’, \’KPL限定\’, \’五五开黑节\’, \’情人节限定\’等】

分别统计点券为888;1788;1688;0(免费)对应哪些皮肤类型,并绘制关系图(同样也是使用可视化平台进行绘制)

  1. for i in range(0,len(price)):
  2. if str(price[i])=="888":
  3. if tp[i] not in c_888:
  4. c_888.append(tp[i])
  5. if str(price[i])=="1788":
  6. if tp[i] not in c_1788:
  7. c_1788.append(tp[i])
  8. if str(price[i])=="0":
  9. if tp[i] not in c_0:
  10. c_0.append(tp[i])
  11. if str(price[i])=="1688":
  12. if tp[i] not in c_1688:
  13. c_1688.append(tp[i])
  14. """
  15. 888 [\'限定\', \'史诗\', \'KPL限定\', \'五五开黑节\', \'情人节限定\', \'勇者\', \'猪年限定\', \'其他\', \'二周年限定\']
  16. 1788 [\'限定\', \'情人节限定\', \'牛年限定\', \'KPL限定\', \'鼠年限定\', \'猪年限定\', \'狗年限定\']
  17. 0 [\'其他\', \'赛季限定\', \'五周年限定\', \'四周年限定\', \'勇者\', \'三周年限定\', \'战队赛专属\']
  18. 1688 [\'限定\', \'FMVP\', \'传说\', \'其他\']
  19. """

888点券对应皮肤类型

1788点券对应皮肤类型

0点券对应皮肤类型

1688点券对应皮肤类型

今天的文章就到这里了

上面所涉及的可视化都是通过辰哥的可视化平台进行制作。感兴趣的小伙伴可以去看看(show.chenlove.cn)

1. 本文详细介绍了python爬虫获取《王者荣耀》英雄皮肤信息并且可视化

2. 本文仅供读者学习使用,不做其他用途!

版权声明:本文为chenlove原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/chenlove/p/15151444.html