Python爬虫爬取Web页面图片

NancyRM 2021-08-16 原文

从网页页面上批量下载jpg格式图片，并按照数字递增命名保存到指定的文件夹

Web地址：http://news.weather.com.cn/2017/12/2812347.shtml

打开网页，点击F12查看

代码实现：

import urllib
import urllib.request
import re

#解析页面
def load_page(url):
    request=urllib.request.Request(url) #发送网络请求
    response=urllib.request.urlopen(request) #根据url打开页面
    data=response.read() #获取页面响应数据
    return data


#下载图片
def get_image(html):
    regx=r\'http://[\S]*jpg\'  #定义正则表达式
    pattern=re.compile(regx)   #编译表达式构造匹配模式
    get_image=re.findall(pattern,repr(html))  #进行正则匹配并返回结果

    num = 1
    #遍历获取的图片
    for img in get_image:
        image=load_page(img)
        #将图片存入到指定文件夹
        with open(\'E:\\Photo\\%s.jpg\' %num,\'wb\') as fb:
            fb.write(image)
            print("正在下载第%s张图片" %num)
            num = num + 1
    print("下载完成！")

url=\'http://news.weather.com.cn/2017/12/2812347.shtml\'
html=load_page(url)
get_image(html)

结果：

版权声明：本文为NancyRM原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/NancyRM/p/8066200.html

Python爬虫爬取Web页面图片的更多相关文章

Python爬虫入门教程 39-100 天津市科技计划项目成果库数据抓取 scrapy
爬前叨叨缘由今天本来没有打算抓取这个网站的，无意中看到某个微信群有人问了一嘴这个网站，想看一下有什么特别复 […]...
Python爬虫入门教程 15-100 石家庄政民互动数据爬取
写在前面今天，咱抓取一个网站，这个网站呢，涉及的内容就是网友留言和回复，特别简单，但是网站是gov的。网址 […]...
python爬虫——汽车之家数据
python爬虫——汽车之家数据相信很多买车的朋友，首先会在网上查资料，对比车型价格等，首选就是“汽车之家” […]...
Python爬虫（二）——发送请求
在了解了爬虫的相关概念后我们就要进行具体的操作了。而第一步就是从网页中获取相应的数据。 1. requests […]...
Python爬虫入门教程 9-100 河北阳光理政投诉板块
写在前面之前几篇文章都是在写图片相关的爬虫，今天写个留言板爬出，为另一套数据分析案例的教程做做准备，作为一个 […]...
python模块之urllib.request基础使用
urllib模块 urllib模块简介： urllib提供了一系列用于操作URL的功能。包含urllib.re […]...
Python爬虫入门教程 12-100 半次元COS图爬取
写在前面今天在浏览网站的时候，忽然一个莫名的链接指引着我跳转到了半次元网站 https://bcy.net/ […]...
Python爬虫 | re正则表达式解析html页面
正则表达式（Regular Expression）是一种文本模式，包括普通字符（例如，a 到 z 之间的字 […]...

随机推荐

win7下MySQL的安装配置及卸载笔记分享
一.官网下载地址：https://dev.mysql.com/downloads/mysql/ 1. […]...
Python中的迭代器、生成器、装饰器
1. 迭代器 1 """ 2 iterator 3 迭代器协议：对象必须提供一个next()方法，执行 […]...
理解OpenShift（3）：网络之 SDN
理解OpenShift（1）：网络之 Router 和 Route 理解OpenShift（2）：网络之 DN […]...
Project Professional 2016 项目管理信息系统（3）–“设置进度计划对比流程”
设置进度计划对比流程 1）设置比较基线：项目–设置基线–确定 2） […]...
NgRx/Store 4 + Angular 5使用教程
这篇文章将会示范如何使用NgRx/Store 4和Angular5。@ngrx/store是基于RxJS的状态 […]...
c++读写MySQL
看过很多C或是C＋＋操作MySQL数据库的文章，大部分太吃力了，甚至有一部分根本没有很好的组织文字，初学者 […]...
Hibernate 插入,修改,删除,查询语句
/* *具体操作hibernate的类 *增加,删除,修改,按ID查询,模糊查询,查询全部 **/ publi […]...
jQuery
jQuery现在需要知道的是，只要浏览器加载页面，function 中放入的代码就会运行。有一点很重要，如果没有 document re...

展开目录

目录导航