Xpath语法格式总结

来源:脚本之家  责任编辑:小易  

这涉及到采集了吧 先采集 然后在取值

经常在工作中会使用到XPath的相关知识,但每次总会在一些关键的地方不记得或不太清楚,所以免不了每次总要查一些零碎的知识,感觉即很烦又浪费时间,所以对XPath归纳及总结一下。

在您截图窗口点右键选择“复制xpath”

在这篇文章中你将能学习到:

没有xvds这个字,只有xenon这个字,意思是氙气。氙气(读音xiān)是惰性气体中相对分子质

XPath简介

荣耀9的音质绝对要比小米6的强,无论是外放还是还是插孔。想要知道外放音质好的条件是什么就要看这部手机的音频设备,因为无论是一部手机想要外放还是耳机孔,输出的的音乐质量都是该手机的音频设备决定的。音频设备是指记录、处理和再现声音的设备,而好的音频设备则可以高质量,甚至堪称完美地完成这一系列过程。目前音频设备有很多,包括麦克风、收音器、CD播放器、磁带录音机、放大器、混音控制台、效果器和扩音器等。可以理解为手机等移动设备可以说是这些设备的缩小版和简化版。也正因为如此,在移动设备上提供高质量音频面临着非常多的挑战。但是荣耀9是采用独立的AK4376HiFi芯片,相对荣耀8的集成Codec模块,解决音

XPath 路径表达式详解

当初与她妈离婚时女儿才一岁哺乳期,除了女儿她不要其它什么也不给,身无分文的我抱着小女儿开始闯江湖,经历的艰难困苦自不必多说,值得庆幸的是我这女儿即聪明又漂亮,父女之间究竟有多恩爱千言万语也无从表述,已是晒晒照片大家看着领悟吧

XPath在DOM,XSLT及XQuery中的应用

看到郭敬明的时候,忽然之间你会发现曾经的一个喜欢的作家,但是无意之间已经开始了进军了娱乐圈,并且已经成为了商人郭敬明,那么郭敬明到底多有钱?而且这些年的郭敬明炫富的新闻已经不是重点了,重点是现在的郭敬明到底有多少钱呢?而且都已经登上了福布斯排行榜,就已经能看得出来郭敬明的不一般了,那么郭敬明到底多有钱??郭敬明到底多有钱这样的问题如果给郭敬明回答,他可能会秀出一身名牌给你看,并不会回答你。郭敬明是个很精明的人,他已经不是作家,而是个精明的商人,他只考虑利益,不会在没有利益的事情上面浪费太多的精力,就像现在炒得这么火热的“郭敬明骚扰男作家”一事,他也只是淡淡的四个字“完全捏造”就不予理会。要说郭

XPath简介

您好!国产车现在都有一个卖点,就是大,各种大,非常的霸气,不知道是不是研究国人的心里了吧,就跟国人喜欢金色一样,总感觉这么大气特有面子,这样就忽视了车辆本身的质量问题,内饰方面比较粗糙一点,不过我个人认为还可以接受,毕竟买车主要追求质量,这款车其他问题都还好,主要是减震器异响的问题,非常多,这个是真的影响驾驶啊,开句玩笑,在野外车震是都没心情了,好了言归正传,荣威360和宝骏560、730用的一家减震器供应商,所以异响问题都比较多,唯一庆幸的是厂家并没有不管,并且积极提出解决方案,虽然不能完完全全解决,但态度还是可以的。

XPath是W3C的一个标准。它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计。目前有XPath1.0和XPath2.0两个版本。其中Xpath1.0是1999年成为W3C标准,而XPath2.0标准的确立是在2007年。W3C关于XPath的英文详细文档请见:http://www.w3.org/TR/xpath20/ 。

XPath是一种表达式语言,它的返回值可能是节点,节点集合,原子值,以及节点和原子值的混合等。XPath2.0是XPath1.0的超集。它是对XPath1.0的扩展,它可以支持更加丰富的数据类型,并且XPath2.0保持了对XPath1.0的相对很好的向后兼容性,几乎所有的XPath2.0的返回结果都可以和XPath1.0保持一样。另外XPath2.0也是XSLT2.0和XQuery1.0的用于查询定位节点的主表达式语言。XQuery1.0是对XPath2.0的扩展。关于在XSLT和XQuery中使用XPath表达式定位节点的知识在后面的实例中会有所介绍。

在学习XPath之前你应该对XML的节点,元素,属性,原子值(文本),处理指令,注释,根节点(文档节点),命名空间以及对节点间的关系如:父(Parent),子(Children),兄弟(Sibling),先辈(Ancestor),后代(Descendant)等概念有所了解。这里不在说明。

XPath路径表达式

在本小节下面的内容中你将可以学习到:

路径表达式语法

相对/绝对路径

表达式上下文

谓词(筛选表达式)及轴的概念

运算符及特殊字符

常用表达式实例

函数及说明

这里给出一个实例Xml文件。下面的说明及实例都是基于该XML文件。

<?xml version="1.0" encoding="UTF-8"?> <!-- edited with XMLSpy v2008 rel. 2 sp2 (http://www.altova.com) by Administrator --> <?xml-stylesheet type="text/xsl" href="messages.xsl" rel="external nofollow" ?> <messages> <message id="1"> <sender>gukaitong@gmail.com</sender> <to>anonymous@gmail.com <group name="IT"> <address>111@gmail.com</address> <address>222@gmail.com</address> <address>aaa@gmail.com</address> <address>bbb@gmail.com</address> <address>ccc@gmail.com</address> </group> </to> <subject>This is a sample</subject> <datetime date="2008-12-11" time="12:00:00" formatted="12/11/2008 12:00AM">2008-12-11T12:00:00Z</datetime> <body> Are you interested in? <attachments> <attachment id="1"> <message id="0"> <sender>anonymous@gmail.com</sender> <to>gukaitong@gmail.com</to> <body> We strongly recommend the following books <books xmlns:amazon="http://www.amazon.com/books/schema"> <amazon:book> <name>Professional C# 2008 </name> <country>USA</country> <price>37.79</price> <year>2007</year> </amazon:book> <amazon:book> <name>Microsoft Visual C# 2008 Step by Step </name> <country>USA</country> <price>26.39 </price> <year>2008</year> </amazon:book> <amazon:book> <name>C# in Depth</name> <country>USA</country> <price>29.69 </price> <year>2006</year> </amazon:book> <amazon:book> <name>Thinking in Java</name> <country>USA</country> <price>23.69 </price> <year>2004</year> </amazon:book> </books> </body> </message> </attachment> </attachments> </body> </message> <message id="2"> <sender>333@gmail.com</sender> <to>444@gmail.com</to> <subject>No title</subject> <body/> </message> </messages>

路径表达式语法:

路径 = 相对路径 | 绝对路径

XPath路径表达式 = 步进表达式 | 相对路径 "/"步进表达式。

步进表达式=轴 节点测试 谓词

说明:

其中轴表示步进表达式选择的节点和当前上下文节点间的树状关系(层次关系),节点测试指定步进表达式选择的节点名称扩展名,谓词即相当于过滤表达式以进一步过滤细化节点集。

谓词可以是0个或多个。多个多个谓词用逻辑操作符and, or连接。取逻辑非用not()函数。

请看一个典型的XPath查询表达式:/messages/message//child::node()[@id=0],其中/messages/message是路径(绝对路径以"/"开始),child::是轴表示在子节点下选择,node()是节点测试表示选择所有的节点。[@id=0]是谓词,表示选择所有有属性id并且值为0的节点。

相对路径与绝对路径:

如果"/"处在XPath表达式开头则表示文档根元素,(表达式中间作为分隔符用以分割每一个步进表达式)

如:/messages/message/subject是一种绝对路径表示法,它表明是从文档根开始查找节点。假设当前节点是在第一个message节点【/messages/message[1]】,则路径表达式subject(路径前没有"/")这种表示法称为相对路径,表明从当前节点开始查找。具体请见下面所述的"表达式上下文"。

表达式上下文(Context):

上下文其实表示一种环境。以明确当前XPath路径表达式处在什么样的环境下执行。例如同样一个路径表达式处在对根节点操作的环境和处在对某一个特定子节点操作的环境下执行所获得的结果可能是完全不一样的。也就是说XPath路径表达式计算结果取决于它所处的上下文。

XPath上下文基本有以下几种:

当前节点(./):

如./sender表示选择当前节点下的sender节点集合(等同于下面所讲的"特定元素",如:sender)

父节点(../):

如../sender表示选择当前节点的父节点下的sender节点集合

根元素(/):

如/messages表示选择从文档根节点下的messages节点集合.

根节点(/*):

这里的*是代表所有节点,但是根元素只有一个,所以这里表示根节点。/*的返回结果和/messages返回的结果一样都是

messages节点。

递归下降(//):

如当前上下文是messages节点。则//sender将返回以下结果:

/messages//sender :

<sender>gkt1980@gmail.com</sender>

<sender>111@gmail.com</sender>

<sender>333@gmail.com</sender>

/messages/message[1]//sender:

<sender>gkt1980@gmail.com</sender>

<sender>111@gmail.com</sender>

我们可以看出XPath表达式返回的结果是:从当前节点开始递归步进搜索当前节点下的所有子节点找到满足条件的节点集。

特定元素

如sender:表示选择当前节点下的sender节点集合,等同于(./sender)

注意:在执行XPath时一定要注意上下文。即当前是在哪个节点下执行XPath表达式。这在XMLDOM中很重要。如:在XMLDOM中的selectNodes,selectSingleNode方法的参数都是一个XPath表达式,此时这个XPath表达式的执行上下文就是调用这个方法的节点及它所在的环境。更多信息请参见:http://www.w3.org/TR/xpath20/

谓词(筛选表达式)及轴的概念:

XPath的谓词即筛选表达式,类似于SQL的where子句.

轴名称

结果

ancestor

选取当前节点的所有先辈(父、祖父等)

ancestor-or-self

选取当前节点的所有先辈(父、祖父等)以及当前节点本身

attribute

选取当前节点的所有属性

child

选取当前节点的所有子元素。

descendant

选取当前节点的所有后代元素(子、孙等)。

descendant-or-self

选取当前节点的所有后代元素(子、孙等)以及当前节点本身。

following

选取文档中当前节点的结束标签之后的所有节点。

namespace

选取当前节点的所有命名空间节点

parent

选取当前节点的父节点。

preceding

直到所有这个节点的父辈节点,顺序选择每个父辈节点前的所有同级节点

preceding-sibling

选取当前节点之前的所有同级节点。

self

选取当前节点。

运算符及特殊字符:

运算符/特殊字符

说明

/

此路径运算符出现在模式开头时,表示应从根节点选择。

//

从当前节点开始递归下降,此路径运算符出现在模式开头时,表示应从根节点递归下降。

.

当前上下文。

..

当前上下文节点父级。

*

通配符;选择所有元素节点与元素名无关。(不包括文本,注释,指令等节点,如果也要包含这些节点请用node()函数)

@

属性名的前缀。

@*

选择所有属性,与名称无关。

:

命名空间分隔符;将命名空间前缀与元素名或属性名分隔。

( )

括号运算符(优先级最高),强制运算优先级。

[ ]

应用筛选模式(即谓词,包括"过滤表达式"和"轴(向前/向后)")。

[ ]

下标运算符;用于在集合中编制索引。

|

两个节点集合的联合,如://messages/message/to | //messages/message/cc

-

减法。

div,

浮点除法。

and, or

逻辑运算。

mod

求余。

not()

逻辑非

=

等于

!=

不等于

特殊比较运算符

< 或者 <

<= 或者 <=

> 或者 >

>= 或者 >=

需要转义的时候必须使用转义的形式,如在XSLT中,而在XMLDOM的scripting中不需要转义。

常用表达式实例:

/

Document Root文档根.

/*

选择文档根下面的所有元素节点,即根节点(XML文档只有一个根节点)

/node()

根元素下所有的节点(包括文本节点,注释节点等)

/text()

查找文档根节点下的所有文本节点

/messages/message

messages节点下的所有message节点

/messages/message[1]

messages节点下的第一个message节点

/messages/message[1]/self::node()

第一个message节点(self轴表示自身,node()表示选择所有节点)

/messages/message[1]/node()

第一个message节点下的所有子节点

/messages/message[1]/*[last()]

第一个message节点的最后一个子节点

/messages/message[1]/[last()]

Error,谓词前必须是节点或节点集

/messages/message[1]/node()[last()]

第一个message节点的最后一个子节点

/messages/message[1]/text()

第一个message节点的所有子节点

/messages/message[1]//text()

第一个message节点下递归下降查找所有的文本节点(无限深度)

/messages/message[1] /child::node()

/messages/message[1] /node()

/messages/message[position()=1]/node()

//message[@id=1] /node()

第一个message节点下的所有子节点

//message[@id=1] //child::node()

递归所有子节点(无限深度)

//message[position()=1]/node()

选择id=1的message节点以及id=0的message节点

/messages/message[1] /parent::*

Messages节点

/messages/message[1]/body/attachments/parent::node()

/messages/message[1]/body/attachments/parent::* /messages/message[1]/body/attachments/..

attachments节点的父节点。父节点只有一个,所以node()和* 返回结果一样。

(..也表示父节点. 表示自身节点)

//message[@id=0]/ancestor::*

Ancestor轴表示所有的祖辈,父,祖父等。

向上递归

//message[@id=0]/ancestor-or-self::*

向上递归,包含自身

//message[@id=0]/ancestor::node()

对比使用*,多一个文档根元素(Document root)

/messages/message[1]/descendant::node()

//messages/message[1]//node()

递归下降查找message节点的所有节点

/messages/message[1]/sender/following::*

查找第一个message节点的sender节点后的所有同级节点,并对每一个同级节点递归向下查找。

//message[@id=1]/sender/following-sibling::*

查找id=1的message节点的sender节点的所有后续的同级节点。

//message[@id=1]/datetime/@date

查找id=1的message节点的datetime节点的date属性

//message[@id=1]/datetime[@date]

//message/datetime[attribute::date]

查找id=1的message节点的所有含有date属性的datetime节点

//message[datetime]

查找所有含有datetime节点的message节点

//message/datetime/attribute::*

//message/datetime/attribute::node()

//message/datetime/@*

返回message节点下datetime节点的所有属性节点

//message/datetime[attribute::*]

//message/datetime[attribute::node()]

//message/datetime[@*]

//message/datetime[@node()]

选择所有含有属性的datetime节点

//attribute::*

选择根节点下的所有属性节点

//message[@id=0]/body/preceding::node()

顺序选择body节点所在节点前的所有同级节点。(查找顺序为:先找到body节点的顶级节点(根节点),得到根节点标签前的所有同级节点,执行完成后继续向下一级,顺序得到该节点标签前的所有同级节点,依次类推。)

注意:查找同级节点是顺序查找,而不是递归查找。

//message[@id=0]/body/preceding-sibling::node()

顺序查找body标签前的所有同级节点。(和上例一个最大的区别是:不从最顶层开始到body节点逐层查找。我们可以理解成少了一个循环,而只查找当前节点前的同级节点)

//message[@id=1]//*[namespace::amazon]

查找id=1的所有message节点下的所有命名空间为amazon的节点。

//namespace::*

文档中的所有的命名空间节点。(包括默认命名空间xmlns:xml)

//message[@id=0]//books/*[local-name()='book']

选择books下的所有的book节点,

注意:由于book节点定义了命名空间<amazone:book>.若写成//message[@id=0]//books/book则查找不出任何节点。

//message[@id=0]//books/*[local-name()='book' and namespace-uri()='http://www.amazon.com/books/schema']

选择books下的所有的book节点,(节点名和命名空间都匹配)

//message[@id=0]//books/*[local-name()='book'][year>2006]

选择year节点值>2006的book节点

//message[@id=0]//books/*[local-name()='book'][1]/year>2006

指示第一个book节点的year节点值是否大于2006.

返回xs:boolean: true

函数及说明:

值得欣喜的是XPath函数和XSLT,XQuery等共享函数库,函数库为我们提供了功能丰富的各种函数的调用,我们也可以自定义自己的函数。这里不再对每个函数的用法逐一说明,中文的可以参考这个网站, //www.zgxue.com/w3school/xpath/index.htm

XPath在DOM,XSLT及XQuery中的应用

DOM:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>XPath Test</title> </head> <body> <script language="javascript" type="text/javascript"> var xmlDoc = new ActiveXObject("Microsoft.XMLDOM"); xmlDoc.async="false"; xmlDoc.load("messages.xml"); xmlDoc.setProperty("SelectionLanguage", "XPath"); var sPath = "/messages/message[1]//books/*[local-name()='book']"; var bookNodes = xmlDoc.selectNodes(sPath); document.write("<ul>"); for ( var i = 0; i < bookNodes.length; i++) { document.write("<li>" + bookNodes[i].childNodes[0].text + "</li>"); } document.write("</ul>"); </script> </body> </html>

注意:

我们若使用new ActiveXObject("Microsoft.XMLDOM")则需要注意的是:因为早期的XMLDOM的SelectionLanguage属性默认是正则表达式,不是XPath语言。所以需要指定这样一条语句xmlDoc.setProperty("SelectionLanguage", "XPath"); 以支持XPath查询表达式。.

若没有指定SelectionLanguage属性值为XPath则要注意以下情况:

数组下标从0开始(我们知道在XPath查询表达式中数组下标是从1开始的)不支持在XPath查询表达式中使用XPath函数。

总结

以上就是本文关于Xpath语法格式总结的全部内容,希望对大家有所帮助。感兴趣的朋友可以参阅:MYSQL updatexml()函数报错注入解析、OGNL表达式基本语法与用法详解、前端常见跨域解决方案(全)等,有什么问题可以随时留言,欢迎大家讨论交流。

扩展阅读,根据您访问的内容系统为您准备了以下内容,希望对您有帮助。

xpath 语法中#代表什么意思

没有xvds这个字,只有xenon这个字,意思是氙气。

氙气(读音xiān)是惰性气体中相对分子质量比较大的一种,原子半径较大。它的原子序数54,外围电子排布5s2 5p6,位于第五周期0族,原子共价半径209皮米,第一电离能1172kJ/mol。单质的氙气由单原子分子构成,相对分子质量是131,无化学键,是一种稀有气体,无色、无臭、无味,密度5.887千克/立方米,熔点-111.9℃,沸点-107.1±3℃,20℃时每升水中可溶解110.9毫升(体积)。能吸收X射线。

氙气化学性质不活泼。能跟水,氢醌、苯酚等形成弱键包合物,在加热或紫外线照射、放电条件下,氙气可跟氟气直接化合生成二氟化氙、四氟化氙、六氟化氙等氟化物,四氟化氙和六氟化氙强烈水解可得到六氧化氙或四氟化氧氙等。在电场作用下能发出强烈的白光。用于制高压长弧氙灯(俗称人造小太阳),产生紫外线的高压电弧灯、闪光灯、中子计数器,X射线计数器,还用作麻醉剂、原子反应堆中的中子吸收剂、充填闸流管和探测宇宙线用的电离室。1898年英国人拉姆塞和特拉威斯在分馏液态氪的混合物时,通过光谱分析发现了氙气。在空气中含有9×10%(体积)。工业上用分馏液体空气提取。

在弧光放电中,电子与气体发生弹性碰撞损失的能量同气体的原子量成反比,所以与其他惰性气体相比氙气弧光放电时损失较小,发光效率高。同时,氙气的电离电势较低,放电时电极附近的电压降小,这样可以延长电极的寿命。又由于氙原子结构的特点,长弧氙灯发出的光谱和日光非常接近,所以汽车灯里充入氙气比充入其它的气体效果好,这也是氙气灯的最大特点。

氙气的“体重”在惰性气体中排行老二,几乎已在地球大气层中绝迹,证据随处可见,但原因却难以确定。德国地质学家发表研究显示,氩气和其他稀有气体隐藏在钙 钛矿中,但大多数氙气却不能溶解其中,并消失在太空中。地球冷却后,氩气和其他惰性气体开始渗透到钙钛矿中并填充到大气中。而氙气作为痕量级溶解于钙钛矿的物质,也只是以痕量级存在于大气中。但法国科学家却对此持怀疑态度,认为在火星氙气消失现象也可被解释时,地球氙气消失的谜题才能真正解开。

元音字母e在重读开音节里发长元音/i/的音,发音时,舌端靠近下齿,舌前部抬得很高,但不接触上颚,不发生任何摩擦,牙床接近合,唇形扁平,这个音出现在字首、字中和字尾的位置,如:

even 偶数的

meter 米

fever 发烧

zebra 斑马

he 他(主格)

we 我们(主格)

me 我(宾格)

be 是

希望我能帮助你解疑释惑。本回答被提问者采纳

一个xpath语法的问题

/html/body/form/input[1]

/html/body/form/input[@name='username']

python xpath语法问题?

需要先找到两个节点的共同点,然后用正则(规则)表达式来提取。

'</span>(.+?)<'import re

text = '''<div class="con"><a href="北苑租房_北京北苑房屋出租(北京链家网)">北苑租房</a><span>/</span>高楼层(共28层)<span>/</span>2011年建板楼</div>'''

list1 = re.findall('</span>(.+?)<', text)

for list2 in list1:

    print(list2)

输出结果:高楼层(共28层)

2011年建板楼

不知道是不是你想要的答案。追问正则可以实现,我只是想用xpath实现

xpath语法问题,关于解析html,如何获取节点内容,谢谢!

虽然我没用过java,但是我敢肯定 node.toString() 就是你想要的

XML中的XPATH语法的'/'和'//'的区别在哪里?

/是在它的子结点中查找,而//是在它的所有子结点中查找,包括子结点的子结点等等

比如:

<root>

<lev1>

<lev2>lev2_1</lev2>

</lev1>

<lev2>

lev2_2

</lev2>

</root>

那么如果用lev1/lev2只能得到文本是lev2_2的这个结点,而如果用lev1//lev2,则两个lev2结点都能得到

  • 本文相关:
  • htmlcleaner使用方法及xpath语法初探
  • 解析xpath语法之在c#中使用xpath的示例详解
  • jquery 选择器 xpath 语法应用
  • 使用纯html的通用数据管理和服务
  • xml和jsp的联手
  • xml文档搜索使用小结
  • xml轻松学习手册(二):xml概念
  • xsl简明教程(1)xsl入门
  • 了解web页面工具语言xml(二)定义
  • 使用dom创建xml
  • 利用xml开发留言板简单的例子
  • 用xml和xsl来生成动态页面
  • 使用php dom-xml创建和解析xml文件
  • xpath 语法中#代表什么意思
  • 一个xpath语法的问题
  • python xpath语法问题?
  • xpath语法问题,关于解析html,如何获取节点内容,谢谢!
  • XML中的XPATH语法的'/'和'//'的区别在哪里?
  • 在车头浏览器中使用xpath语法如何判断分页是否到了最后一页
  • Xpath语法问题,robot framework自动化测试用到的,可以帮我写这个Xpath语法吗?...
  • 这个xpath语法是什么意思
  • 免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved