Python爬虫之简单的图片获取

dennis-liucd 2021-08-26 原文

简单的静态网页的图片获取：

import urllib
import re
import os

url = \'http://www.toutiao.com/a6467889113046450702/\'

def getHTML(url):
    html = urllib.request.urlopen(url).read()
    return html

def getIMG(html):
    s = r\'img src=&quot;(http://.+?)&quot\'
    pat = re.compile(s)
    imglist = pat.findall(html)
    return imglist
    
html = getHTML(url)
html = html.decode(\'UTF-8\')
imglist = getIMG(html)
imgname = 0
path = \'D:\\pic\\\'
if not os.path.isdir(path):
    os.mkdir(path)
    print(\'创建文件夹%s\'%path)

for url in imglist:
    filepath = path+\'%d.jpg\'%imgname
    print(\'正在下载第%d张照片...\' % (imgname+1))
    urllib.request.urlretrieve(url, filepath )
    imgname = imgname+1
    
print(\'下载完成!\')

动态网页图片获取

版权声明：本文为dennis-liucd原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/dennis-liucd/p/7568199.html

Python爬虫之简单的图片获取的更多相关文章

随机推荐

批处理向FTP上传指定属性的文件批处理增量备份的例子
使用windows批处理向FTP上传具有指定属性的文件,类似增量备份功能。对一个目录里的几个文件自动上传F […]...
Dubbo项目入门
Dubbo是一款高性能、轻量级的开源Java RPC框架，它提供了三大核心能力：面向接口的远程方法调用，智能容 […]...
看源码学编程系列之开篇
　　最近由于一些原因，接触了一些房产中介，其中发现一些房产中介说起房产相关的东西来，是滔滔不绝，对于所在片区楼 […]...
实现返回顶部-wepy小程序-前端梳理
<script type="text/javascript" src="http://hovertree […]...
怎样为EXCEL2010添加下拉列表 – 蝈蝈俊
注意，下面是Excel2010的步骤和截图，其他版本的Excel类似。首先用鼠标左键点击你要添加下拉列表 […]...
美团点评云真机平台实践 – zouhui
美团点评云真机平台实践 2019-06-05 19:44 zouhui 阅读(321) 评论(0) 编 […]...
单元测试 – Tests和UITests (一) 业务测试
单元测试假如我们今天去面试了，面试官问了一句“什么是单元测试？有没有使用？大概是针对那些 […]...
Leetcode 535: Encode and Decode TinyURL
TinyURL is a URL shortening service where you enter a U […]...

展开目录

目录导航