发现一个很棒的壁纸网站，所以我们应该把它爬取下来

hhh188764 2020-10-24 原文

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

最近又发现了一个很棒的壁纸网站

环境

Python3.6
pycharm

本次目标

爬取网站高清

网站地址

https://wallhaven.cc/

爬虫代码

导入工具

import requests
import re

请求网站

url = 'https://wallhaven.cc/toplist?page={}'.format(page)
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网站数据

for i in urls:
    response_2 = requests.get(url=i, headers=headers)
    img_url = re.findall('<img id="wallpaper" src="(.*?)"', response_2.text, re.S)[0]
    title = img_url.split('-')[-1]
    download(title, img_url)

保存数据

def download(title, url):
    path = '保存地址' + title
    response = requests.get(url=url)
    with open(path, mode='wb') as f:
        f.write(response.content)

版权声明：本文为hhh188764原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/hhh188764/p/13869265.html

发现一个很棒的壁纸网站，所以我们应该把它爬取下来的更多相关文章

一个简单的网站爬虫教程，让你了解爬虫的步骤，爬虫网页数据采集
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...
Python-joypy和 R-ggridges 峰峦图制作
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以 […]...
S10 TES的八强赛，创造了奇迹，看看比赛时网友们怎么说的
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...
Python爬虫训练：爬取酷燃网视频数据
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...
如何使用Python爬取基金数据，并可视化显示
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以 […]...
发现一个好网站，人间尤物、魅惑黑丝都是福利呀！那就都爬取下来
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...
对于某东平台XX娃娃的用户体验进行（严肃、限速）数据分析
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...
如何让程序像人一样的去批量下载歌曲？Python爬取付费歌曲
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...

随机推荐

年终终结(跨语言跨行业)
年终终结(跨语言跨行业) 　　伴随着oa转正流程的结束，也正式转正了，随着年会的结束，这一年的工作也要接近尾声 […]...
使用DOS批处理更改IP地址
有时候电脑在家需要自动获取IP，在公司需要手动填写IP，改来改去很麻烦，于是做一个批处理一键修改很方便： @e […]...
真正提升关键词排名的外链应该怎样发？
　　咱们闲话短续进入今天主题，当下网站优化外链怎样发布才能真正提升关键词排名? 其实自己最近一直想写一篇关于网 […]...
数据页结构 .InnoDb行格式、以及索引底层原理分析
局部性原理局部性原理是指CPU访问存储器时，无论是存取指令还是存取数据，所访问的存储单元都趋于聚集在一个较小 […]...
Android 设置闹铃步骤和基础代码
主要分三步： 1. 设置闹铃时间; 2. 接收闹铃事件广播; 3. 重开机后重新计算并设置闹铃时间; 1. […]...
会声会影和爱剪辑哪个好用
　　会声会影将易用性和突破性的创造性结合起来，使视频编辑更加有趣！使用创新的智能新工具和流线型的用户界面，快速 […]...
浏览器爬虫入门：Python+Selenium+ChromeDriver
下载对应版本的chromedriver.exe： http://chromedriver.storage.go […]...
C++libcurl的使用
C++libcurl的使用一、libcurl描述：　　在curl的官方网站 **http://curl.h […]...

展开目录

目录导航