分享一款谷歌浏览器Chrome的插件——XPath Helper,一款非常实用的xpath路径解析工具,帮助爬虫开发者查询、验证xpath路径,也可用于简单的信息爬取工作。
XPath Helper 是一款网页 XPath 路径解析工具,将页面元素的 XPath 路径输入其中,它将为你实时呈现:
- 提取出的元素;
- 页面中相应元素高亮;

借助这一功能,你可以实现:
- 确定某些元素在网页中的位置,帮助你开发爬虫:

- 快速提取简单的信息:

由于它是基于浏览器运行的,它分析的页面就是用户看到的页面,因此几乎所有的反爬虫手段都对它无效,对于一些简单的信息爬取工作,还是非常高效的。
下载链接
本篇博客中提到的插件 XPath Helper 可以直接通过下面的链接下载:
下载完成后,打开谷歌浏览器,在网址栏中输入:
1 | chrome://extensions/ |
进入扩展程序页面,首先打开右上角的“开发者模式”:

找到下载好的 .crx
文件,直接将其拖拽至浏览器中,即可完成安装。