bs4笔记

温馨提示: 本文最后更新于2024-08-17 21:03:04,某些文章具有时效性,若有错误或已失效,请在下方 留言或联系 玩偶教程网

bs4进行数据解析

  • 数据解析的原理
    • 1.标签定位
    • 2.提取标签,标签属性中存储的数据值
  • bs4实现数据解析的原理
    • 实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中
    • 通过调用BeautifulSoup对象中相关属性或者方法进行标签定位和数据提取
  • 如何实例化BeautifulSoup对象
    • from bs4 import BeautifulSoup
    • 对象的实例化
      • 将本地的html文档中的数据加载到该对象中
        • from bs4 import BeautifulSoup
          if __name__ == ‘__main__’:
          a = open(‘菜单.html’,”r”,encoding=’utf-8′)
          b= BeautifulSoup(a,’lxml’)
          print(b)
      • 将互联网上的页面源码加载到该对象中
        • from bs4 import BeautifulSoup
          import requests

          if __name__ == ‘__main__’:
          url = ‘https://www.baidu.com’
          response = requests.get(url).text
          print(BeautifulSoup(response,’lxml’))
    • 提供用于数据解析的方法和属性

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容