python爬虫--小猪短租的租房信息

november1943 2021-10-26 原文

python爬虫–小猪短租的租房信息

利用requests获取网页
利用Beautifulsoup4和lxml解析网页

具体代码如下

from bs4 import BeautifulSoup
import requests

url = \’http://bj.xiaozhu.com/fangzi/1508951935.html\’
web_data = requests.get(url)
soup = BeautifulSoup(web_data.text, \’lxml\’)

title = soup.select(\’div.pho_info > h4 \’)[0].text
address = soup.select(\’div.pho_info > p \’)[0].get(\’title\’)
price = soup.select(\’div.day_l > span\’)[0].text
first_pic = soup.select(\’#curBigImage\’)[0].get(\’src\’)
landlord_pic = soup.select(\’div.member_pic > a > img\’)[0].get(\’src\’)
landlord_name = soup.select(\’div.w_240 > h6 > a\’)[0].text
if soup.select(\’span[class=”member_girl_ico”]\’):
landlord_gender = \’female\’
else:
landlord_gender = \’male\’

data = {
\’title\’: title,
\’address\’: address,
\’price\’: price,
\’first_pic\’: first_pic,
\’landlord_pic\’: landlord_pic,
\’landlord_name\’: landlord_name,
\’landlord_gender\’: landlord_gender
}
print(data)

版权声明：本文为november1943原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/november1943/p/5230924.html

python爬虫--小猪短租的租房信息的更多相关文章

随机推荐

用小程序·云开发打造运动圈小程序丨实战
乒乓圈小程序和朋友合伙写了一个小程序，写了一个以共享乒乓信息和交流的平台———乒乓圈。我们使用了微信的云开发 […]...
没看《庆余年》电视剧和小说，我大概知道了这些
——————理科生用技术方法看《庆余年》—————— 最近电视剧《庆余年》上了几次微博热搜，身边好多朋友也在讨 […]...
SAP S/4嵌入式分析——虚拟数据模型（VDM）
　　在本文中，我会通过CDS视图来介绍虚拟数据模型（Virtual Data Model，以下简称VDM）。 […]...
dataset的使用和图片延时加载的实现
首先，先介绍一下关于javascript中dataset属性。。html5中可以使用data-前缀设置我们需要 […]...
旧手机小用途：在Android手机上建网站，较完全指南
做个人服务器就是一个不错的用途：功耗低，还自带UPS。做个个人网站，个人云或下载机，7×24小时开机 […]...
lnmp或者lamp环境一键安装
参考网址：https://lnmp.org/install.html 下载并安装LNMP一键安装包：您可以选 […]...
centos升级内核
本文适用于CentOS 6.4, CentOS 6.5，估计也适用于其他Linux发行版。准备工作确认内核 […]...
公众号课程
源自学习课程笔记一、分类 ·按属性分：订阅号、服务号 ·按主体分：个人主体、公司主体（个人只能注册订阅号， […]...

展开目录

目录导航