bs4进行数据解析
- 数据解析的原理
- 1.标签定位
- 2.提取标签,标签属性中存储的数据值
- bs4实现数据解析的原理
- 实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中
- 通过调用BeautifulSoup对象中相关属性或者方法进行标签定位和数据提取
- 如何实例化BeautifulSoup对象
- from bs4 import BeautifulSoup
- 对象的实例化
- 将本地的html文档中的数据加载到该对象中
- from bs4 import BeautifulSoup
if __name__ == ‘__main__’:
a = open(‘菜单.html’,”r”,encoding=’utf-8′)
b= BeautifulSoup(a,’lxml’)
print(b)
- from bs4 import BeautifulSoup
- 将互联网上的页面源码加载到该对象中
- from bs4 import BeautifulSoup
import requests
if __name__ == ‘__main__’:
url = ‘https://www.baidu.com’
response = requests.get(url).text
print(BeautifulSoup(response,’lxml’))
- from bs4 import BeautifulSoup
- 将本地的html文档中的数据加载到该对象中
- 提供用于数据解析的方法和属性
© 版权声明
THE END
暂无评论内容