6-29学习记录

forever121812 2018-06-29 原文

Python

—小白121的记录笔记

Beautifulsoup

beautifulsoup 是爬虫的一个第三方库，主要用于过滤出有用的数据

pip和ide工具都可以进行安装

BeautifulSoup 将 HTML 分成四个对象

Tag
NavigableString
BeautifulSoup
Comment

创建 Beautifulsoup 对象

soup = BeautifulSoup(html)

打印soup对象的内容

print（soup.prettify()

打印 Tag

print(soup.html.encode(‘utf-8’))

print(soup.title.encode(‘utf-8’))

print(soup.head.encode(‘utf-8’))

print(soup.a.encode(‘utf-8’))

print(soup.p.encode(‘utf-8’))

所以 Tag 即使 HTML 里面的各种标签

对于Tag来说，有两个重要的属性

name
attrs

print(soup.title.name)

print(soup.a.attrs)

name 输入当前标签名字

attrs 把a标签的所以属性打印出来

Navigablestring

print(soup.a.string)

显示当前标签的内容

单词

sibling 兄弟姐妹

with 等待

element 要素

document 文档

previous 以前的

本文链接：https://www.cnblogs.com/forever121812/p/9245690.html

随机推荐

Kafka 特性

Kafka 特性标签（空格分隔）： Kafka 支持多个生产者多个生成者连接Kafka来推送消息，这个和其 […]...

树莓派3 编译驱动

分为本地编译和交叉编译，主要是Makefile的写法：本地编译： obj-m := bcm2835-i2s. […]...

基于51的串行通讯原理及协议详解（uart） – 张凌001

基于51的串行通讯原理及协议详解（uart）串行与并行通讯方式并行：控制简单，传输速度快。线多，长距离成本较 […]...

iOS仿写下厨房

先看一下做的效果，是不是还不错？(可以看一下早餐那块的轮播，上面盖着一个都是点点的图片，但是它不是和轮播一起滚 […]...

Oralce 触发器

今天做了一个需要用到触发器实现的功能中间去到了各种问题，还好最后都解决了；整个过程中真是遇到了不少错误：　 […]...

天使轮 A轮 B轮上市…等名词解释

看到一篇漫画解释的很形象: ...

颜色的RGB值

各种金属颜色的RGB值，正确的颜色会有更好的表现效果铝箔 180,180,1 […]...

1.HTML5+CSS3基础学习

1.标题标签、、....... 标题大小依次递减2.段落标签3.换行标签4.文本样式标签文本内容5...

6-29学习记录

Python

6-29学习记录的更多相关文章

随机推荐

热门专题

目录导航