BeautifulSoup基本用法

whisperbb 2021-08-03 原文

BeautifulSoup是可以从HTML或者XML文件中提取数据的Python库

一般配合requests使用

一、引入

from bs4 import BeautifulSoup

BeautifulSoup 所支持的解析器

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment

Tag对象：对象与XML或HTML原生文档中的tag相同
每个tag 都有自己的名字，Tag.name 来获取，tag可能有很多个属性. tag <b class=”boldest”> 有一个 “class” 的属性,值为 “boldest” . tag的属性的操作方法与字典相同: tag[\’class\’] = “boldest”

可以遍历字符串，字符串常被包含在tag内.Beautiful Soup用 NavigableString 类来包装tag中的字符串，tag.string

————————————————
版权声明：本文为CSDN博主「maverick17」的原创文章，遵循CC 4.0 by-sa版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/maverick17/article/details/79610050

版权声明：本文为whisperbb原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/whisperbb/p/11398872.html

BeautifulSoup基本用法的更多相关文章

BeautifulSoup基本用法
BeautifulSoup是Python的一个HTML或XML的解析库，可以用它来方便地从网页提取数据（以下为 […]...
python BeautifulSoup基本用法 – 正义的伙伴！
python BeautifulSoup基本用法 #coding:utf-8 import os from b […]...

随机推荐

数学建模论文观后感—-2010年上海世博会影响力的定量评估
2010年上海世博会影响力的定量评估题目：感兴趣的某个侧面，定量评估2010年上海世博会的影响力【对比新 […]...
内存分页不就够了？为什么还要分段？还有段页式？
你好，我是 yes。关于内存访问你可能听过分段，分页，还有段页式。但是为什么要分段？又为什么要分页？有了 […]...
在苹果Mac上如何将Webp图片转换为jpg、png格式？
在苹果Mac上如何将Webp图片转换为jpg、png格式？您可能已经习惯于从网上看到以广泛使用的png或jp […]...
【长知识】找书攻略
这里有一份最全的搜书资源攻略，囊括了 112 个网站，让你能找到 99% 的电子书，而且不用fq，每一个都是亲 […]...
使用mpvue开发小程序
前言：最近接到小程序的开发需求，由于之前也没开发过小程序，心情还是有点激动。先花15分钟看一遍小程序官方文档 […]...
1-学习前言&C语言概述【C语言】01-学习前言&C语言概述
　　C语言是我去年学的，学的还好吧，但是过了一个假期，感觉很多东西都忘了，说实说，我无法接受这个事实！ […]...
ABP开发框架前后端开发系列—（4）Web API调用类的封装和使用 – 伍华聪
ABP开发框架前后端开发系列—（4）Web API调用类的封装和使用在前面随笔介绍ABP应用框架 […]...
admin快速搭建后台管理系统
一.基于admin后台管理系统的特点：权限管理：权限管理是后台管理系统必不可少的部分,拥有权限管理，可以赋予 […]...

展开目录

目录导航