xpath快速上手

  1. 安装lxml库
1
pip install lxml
  1. 使用lxml

    • etree.parse():解析本地文件
    • etree.HTML():解析服务器响应文件(比较常用)
1
2
3
4
5
from lxml import etree
import requests
r = requests.get("https://www.baidu.com")
html_tree = etree.HTML(r.text)
result=html_tree.xpath("xpath路径") # f

xpath语法

  1. 路径查询
1
2
3
//:查找所有子孙节点,不考虑层级关系 

/ :找直接子节点
  1. 谓词查询
1
2
3
//div[@id] 

//div[@id="maincontent"]
  1. 属性查询
1
//@class 
  1. 模糊查询
1
2
3
//div[contains(@id, "he")] 

//div[starts‐with(@id, "he")]
  1. 内容查询
1
//div/h1/text() 
  1. 逻辑运算
1
2
3
//div[@id="head" and @class="s_down"] 

//title | //price

__END__

三国小梦
文章作者:三国小梦
文章出处使用python解析xpath
作者签名:简单地活着, 肆意又精彩.
关于主题Hexo - Live For Code
版权声明:文章除特别声明外,均采用 BY-NC-SA 许可协议,转载请注明出处