Python编程快速上手（七）Unsplash批量下载器

RhinoC 2019-02-03 原文

V1.0
输入关键字搜索图片，模拟页面下拉获取更多图片，页面加载完成后获取图片链接并下载至指定文件夹。

V2.0
解决了V1.0版本存在的两个严重问题。更改为深入二级链接获取图片，从而不再需要等待一级页面加载完毕。

对于一个图片爬虫来说，连图片都爬不下来得是件多羞耻的事情。所以在面对V1.0版本的诸多不足时，我的当务之急是解决第二个问题，其次再是对程序进行优化。幸运的是，就像问题总是相伴而生一样，解决了第二个问题时，我恰巧也把第一个问题解决了。

首先，疑惑于明明加载了那么久页面却会「获取不到图片链接」，我将加载出来的页面保存下来查看。

page = open(os.path.join('pics', 'saved.html'),'wb')
page.write(soup.encode('utf-8'))

打开saved.html后，我发现虽然图片链接未能加载出来，但是图片所指向的二级链接却赫然在目。

打开二级链接，不出意外，就是我求之而不得的图片。
自然，我就想到，如果在当前这个一级页面不能得到图片链接，是不是可以通过进入二级链接获取图片，而且由于二级链接所指向的页面只有一张图片，图片加载的成功率必然也很高。

如此这般，problems solved

随机推荐

抢了用户的时间，就是抢了用户的金钱！单词锁屏，一个开发难度不太大，但仅仅360手机助手下载就是每周4万！拉风 […]...

git删除远程分支

方法一：直接在git服务端操作：方法二：　　通过命令行删除：　　首先确保仓库(我的仓库名是te […]...

android整合两个bitmap

有时候会遇到这样的需求，将两个bitmap对象整合并保存为一张图片，代码如下： private Bitmap […]...

　　　　前端时间，做一个小网站的时候，需要用到很多小图标，UI设计好之后不知道如何使用，如果使用图片那会很麻烦 […]...

配置centos7 java环境

一、环境 centos7 jdk-8u231-linux-x64.tar.gz 二、安装jdk 使用ftp或者 […]...

View Post 3年开发小姐姐教你零基础如何自学编程？自学编程找一份工作的难度会稍微刻苦点，难度不是特别 […]...

概述：jQuery是我们最常用的js库，对于事件的绑定也是有很多种，on、one、live、bind、dele […]...

之前一直用RedHat el5 server做服务器使用，但是Redhat的yum需要在线更新是需要收费的，所 […]...

Python编程快速上手（七）Unsplash批量下载器的更多相关文章