python之BeautifulSoup标签查找数据
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python之BeautifulSoup标签查找数据,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1272字,纯文字阅读大概需要2分钟。
内容图文
![python之BeautifulSoup标签查找数据](/upload/InfoBanner/zyjiaocheng/591/5a964789005c44f3869270a89712dd92.jpg)
BeautifulSoup常用查询方法归类:
import urllib.request
from bs4 import BeautifulSoup
bs = BeautifulSoup(html,"html.parser")
一、四类主要节点
bs.title #通过标签获取标签 Tag
bs.title.string或bs.title.get_text() #通过标签获取标签里面的内容 NavigableString
bs.a.attrs #获取标签里面的所有属性
bs #获取文档所有内容 BeautifulSoup
二、文档的遍历
contents:contents属性可以将tag的子节点以列表的形式输出(不止tag还有navgableString)
for item in bs.head.contents:
print(item)
三、文档的搜索
#find_all通过字符串匹配某个标签,返回一个列表
a_list = bs.find_all('a')
#通过正则表达式搜索标签,返回一个列表
b_list = bs.find_all(re.compile('a'))
#通过kwargs传入的参数查询
d_list = bs.find_all(id='doubanapp-tip')
d_list = bs.find_all(class_True)
d_list = bs.find_all(href="https://www.baidu.com")
#通过text参数查询
e_list = bs.find_all(text='豆瓣')
e_list = bs.find_all(text=['泰坦尼克号','赎罪'])
e_list = bs.find_all(text = re.compile('\d'))
#通过limit限制显示数据数量
f_list = bs.find_all('a',limit=3)
四、CSS选择器
#1.通过标签查询
g_list = bs.select('a')
#2.通过类名查询
g_list = bs.select('.title')
#3.通过id查询
g_list = bs.select('#tip')
#4.通过属性查询
g_list = bs.select("a[class='tip']")
#5.通过子标签来查询
g_list = bs.select("head > meta >title")
#6.通过兄弟节点查询
g_list = bs.select("meta ~ link")
内容总结
以上是互联网集市为您收集整理的python之BeautifulSoup标签查找数据全部内容,希望文章能够帮你解决python之BeautifulSoup标签查找数据所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。