爬虫实战爬取58同城房源信息

yangyang-1127 2021-09-02 原文

import requests
from lxml import etree
if __name__ == \’__main__\’:
#爬取到页面源码数据
url=\’https://su.58.com/ershoufang/\’
headers={
\’User-Agent\’:\’Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36\’
}
page_text=requests.get(url=url,headers=headers).text
tree=etree.HTML(page_text) #数据解析
#存储li标签对象
li_list=tree.xpath(\’//ul[@class=”house-list-wrap”]/li\’) #这里class属性值应该是双引号 “”
fp= open(\’./58.txt\’,\’w\’,encoding=\’utf-8\’)
for li in li_list:
#页面数据局部解析
title=li.xpath(\’./div[2]/p/span/text()\’)[0]
print(title)
fp.write(title+\’\n\’)

版权声明：本文为yangyang-1127原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/yangyang-1127/p/13878494.html

爬虫实战爬取58同城房源信息的更多相关文章

随机推荐

模拟JQUERY的延迟方法绑定
模拟JQUERY的延迟方法绑定, 对于延迟方法绑定，各种语言都有不同的描述什么回调啊，函数指针啊，委托啊，事 […]...
STM32单片机的学习方法（方法大体适用所有开发版入门）
1，一款实用的开发板。这个是实验的基础，有时候软件仿真通过了，在板上并不一定能跑起来，而且有个开发板在手，什 […]...
Java多线程
多线程基础一、创建线程仅仅只有new Thread这种方法创建线程 Java中无法销毁一个线程，只能表现一 […]...
Docker中使用FlameGraph分析JVM应用性能
开源项目推荐 Pepper Metrics是我与同事开发的一个开源工具(https://github.com/ […]...
鼠标经过按钮，图片缓慢变大效果
<style type="text/css"> .box{ width:50%; max-heig […]...
批量识别图片里面的条形码，然后识别的文本给条形码命名，自动识别条码命名作为文件名称
在工作的过程中经常会遇到条形码的问题，物流行业，快递行业，商品超市行业，经常遇到一大推图片带有条形码的，经常要 […]...
React学习（1）——constructor
1 constructor(props) { 2 super(props); 3 this.state = { […]...
51单片机 | 实现SMC1602液晶屏显示实例
LCD1602显示两行字符 ————————————————————————————————————————— […]...

展开目录

目录导航