XPath 语法  介绍

搞事情之前 必须掌握好基础知识 这里儿编姐就给你 解答一下“XPath 语法”的问题

XPath 是一种在 XML 文件中定位和选择元素的语言 说白了 就是对文档里的元素进行筛选 定位 哪些找出来 哪些留下来

对了 XML 是一种标记语言 有点像 HTML 那些玩意儿 只不过 XML 是用来存储和传输数据的 不过 XPath 可以作用在 HTML 上 也是完全没毛病

小伙子 你想知道怎么使用 XPath?

首先 需要知道 XPath 的语法规则 XPath 里有各种各样的表达式 用来筛选节点 不过我们一步一步来 咱首先先从最简单的开始 逐步涨姿势!

1. 节点选择:

XPath 有两种基本的节点选择方式 一种是选取元素节点 另一种是选取属性节点

要选取元素节点 很简单 直接写节点的名字就好了 举个栗子 你要是想选取 XML 文件里的所有书名 要这么写://书名(注:/ 表示根节点 浏览器里是用 document 表示根节点)

要选取属性节点 也很简单 加一个 @ 符号 举个栗子 就是要选取 XML 文件里所有 title 属性值的节点 要这么写://@title

2. 路径表达式:

小子 你要记住 XPath 是有自己的路径表达式的 也就是说你可以按照一定的规则来定位元素节点或者属性节点

路径表达式有好几种最常见的 就是绝对路径和相对路径 绝对路径就是从根节点到某个节点的路径写法是这样的:/bookstore/book/title

相对路径就是相对于当前节点的路径 一般用.来表示当前节点 再举个栗子 相对路径就是 ./title

小朋友 学了这两个 XPath 的基本知识 你就有能力定位任何一个节点了 还是挺好玩吧!

3. 谓语:

瞧着我 这还没有完呢!接下来咱得说说 XPath 里的谓语 是干啥的呀

谓语啊 就是用来限定节点的 表示的就是节点的特定属性或者子节点 这个时候 XPath 的选择范围就变得更广了 对吧!

小子 小姐 你们要知道 谓语用的是中括号 里面的内容就是筛选条件 搞明白了没有?

举个例子 咱想要选取 XML 文件第一个 price 节点中 price 属性值大于 30 的节点 那么如果你想使用 XPath 的谓语 要这么写://price[@price > 30]

4. 逻辑运算:

你们有没有听说过逻辑运算 就是把两个谓语用 and 或者 or 连接起来的方式

小朋友 你要是想选取 XML 文件里的所有 price 节点中 price 属性既大于 30 又小于 100 的节点 那么要这么写://price[@price > 30 and @price < 100]

5. 通配符:

哎呦 还有通配符 这个东西就更方便了 直接把*放在节点名的位置就好了 它就会匹配该节点的所有子节点

你要是想选取 XML 文件里的所有书的所有属性 你就要这样写://书/*

这下 你们应该把 XPath 语法的基础知识都get到了吧 小伙子 你再问我点问题 如何使用 XPath 在 HTML 中提取数据?

首先 你得有一个 HTML 文档 你可以通过一些工具或者代码爬虫的方式获取到这个文档

有几个可以用 XPath 提取数据的方法:

1. 使用浏览器控制台:

你要是想要提取某个网页的数据 这时候你可以先在浏览器中打开这个网页 然后使用浏览器的控制台来提取数据 见下图:

![image](https://example.com/image.png)

2. 使用语言库:

有一些编程语言提供了自带的库来处理和解析 XML 或者 HTML 文件 这些库往往也提供了使用 XPath 的功能 不妨试试咯~

3. 使用爬虫框架:

还有一种方式 是使用爬虫框架 它们往往提供了强大的功能方便你提取链接和数据 如果你的需求足够复杂 那就试试吧!

好了 部长告诉了你基本的 XPath 语法 那你就得自己去练习了 去写个爬虫程序提取数据吧 这可是个有潜力的技能啊! www.0574web.net 宁波海美seo网络优化公司 是网页设计制作,网站优化,企业关键词排名,网络营销知识和开发爱好者的一站式目的地,提供丰富的信息、资源和工具来帮助用户创建令人惊叹的实用网站。 该平台致力于提供实用、相关和最新的内容,这使其成为初学者和经验丰富的专业人士的宝贵资源。

点赞(106) 打赏

声明本文内容来自网络,若涉及侵权,请联系我们删除! 投稿需知:请以word形式发送至邮箱18067275213@163.com

评论列表 共有 2 条评论

想找帮忙做优化 10月前 回复TA

小站.fsgame.org 个人做的现在才pr=4,希望每年能进步1-2级。

雅雅的世界 1年前 回复TA

还没有找到一个准确检测反链的工具

立即
投稿
发表
评论
返回
顶部