【使用Python的xml.etree查找元素开始和结束字符偏移量】教程文章相关的互联网学习教程文章

java – 获取xml元素的字节/字符

我想知道java中的哪个XML解析器(如果有的话)可以提供它解析的xml元素的字节偏移量. 我正在使用Lucene索引我的XML文件,当我搜索特定单词时,我需要输出包含XML元素,文件名以及字节偏移量,以便我可以快速查找该偏移量.解决方法:查看VTD-XML:http://vtd-xml.sourceforge.net,VTDNav.getContentFragment()对元素的偏移量和长度进行编码:javadoc. 通过将其转换为int(int)VTDNav.getContentFragment()来获得偏移量.

php – XML计数元素,如果id存在增加1【代码】

我想要做的是计算根元素下的元素.然后检查同一级别上的一个id是否具有id值.发生这种情况时,需要增加1. 代码public function _generate_id() {$id = 0;$xpath = new DOMXPath($this->_dom);do{$id++;} while($xpath->query("/*/*[@id=$id]"));return $id; }例如xml<?xml version="1.0"?> <catalog><book id="0"><author>Gambardella, Matthew</author><title>XML Developer's Guide</title><genre>Computer</genre><price>44.95</pr...

从根元素c#中删除xml文件中的所有元素【代码】

我有一个xml文件<Abc> <image filename="1.jpg" heading="1.jpg" /><image filename="10.jpg" heading="10.jpg" /><image filename="11.jpg" heading="11.jpg" /><image filename="2.jpg" heading="2.jpg" /><image filename="3.jpg" heading="3.jpg" /> </Abc>我想删除除root元素之外的所有元素.怎么做到这一点.请帮帮我.解决方法: XmlDocument doc = new XmlDocument(); doc.Load("filename.xml"); doc.DocumentElement.RemoveAl...

python – 使用lxml html从嵌套元素中提取特定元素【代码】

大家好我有一些问题,我认为可以归结为xpath问题.我正在使用lxml包中的html模块来尝试获取一些数据.我提供下面最简化的情况,但请记住我正在使用的HTML更加丑陋.<table><tr><td><table><tr><td></td></tr><tr><td><table><tr><td><u><b>Header1</b></u></td></tr> <tr><td>Data</td></tr></table></td></tr></table></td></tr> </table>我真正想要的是深度嵌套的表,因为它有标题文本“Header1”.我是这样想的:from lxml import html...

c# – 在SVG文件中获取XML元素时出现问题【代码】

我正在尝试阅读一个非常基本的SVG文件,其中包含以下内容:<?xml version="1.0" encoding="UTF-8" standalone="no"?> <svg width="600" height="300" version="1.1" xmlns="http://www.w3.org/2000/svg"><g stroke="black" ><line x1="75" y1="160" x2="525" y2="160" stroke-width="10"/></g> </svg>我正在尝试获取线元素的集合.但是,以下代码不起作用:XDocument XD = XDocument.Load(PathToFile); XElement SVG_Element = XD.Roo...

PHP XML在另一个元素之后(或之前)插入元素【代码】

我有一个以前生成的XML,如下所示:<newsletter><header></magazine></image><strap/></header><intro><date/><text/></edimg></intro><shop><heading/><article/><title/><img/><link/><excerpt/></shop><sidebar><cover/><cover_link/><text/><advert><link/><image/></advert></sidebar></newsletter>我需要能够在< intro>之间插入一个元素.和< shop>分子 这个:$section = $dom->documentElement->appendChild($dom->createElem...

如何在java代码中获取android xml视图元素id属性【代码】

假设我有一个id为@ id / send_button的按钮的xml定义 我如何在Java代码中获取此id属性值?我在AttributeSet类上尝试了getXXX方法,但没有提供任何包含“send_button”的值. EDIT1: 让我说清楚一点吧. 我正在创建一个自定义View组件,我想知道该组件的用户在xml文件中提供的id值是多少. EDIT2: 由于特殊原因,我没有使用自定义属性<mycomponentandroid:id="@+id/my_id"/>编辑3: AttributeSet上有一个getIdAttribute()方法,但它不起作...

在Java中读取XML元素列表【代码】

我想迭代一个XML文档,它本质上是一个相同结构的XML元素列表.元素将被序列化为Java对象.<root><element attribute="value" /><element attribute="value" /><element attribute="value" />... </root>根元素中有很多元素.我宁愿不将它们全部加载到内存中.我意识到我可以使用SAX处理程序,但使用SAX处理程序将所有内容反序列化为Java对象似乎相当迟钝.我发现JDOM非常容易使用,但据我所知,JDOM总是会解析整个树.有没有办法可以使用JDOM...

使用Python的xml.etree查找元素开始和结束字符偏移量【代码】

我有XML数据,看起来像:<xml> The captial of <place pid="1">South Africa</place> is <place>Pretoria</place>. </xml>我希望能够提取: >目前在etree中提供的XML元素.>文档的完整纯文本,在开始和结束标记之间.>每个开始元素的纯文本中的位置,作为字符偏移量. (3)是目前最重要的要求; etree提供(1)罚款. 我无法直接看到任何方法(3),但希望迭代文档树中的元素将返回许多可以重新组装的小字符串,从而提供(2)和(3).但是,请求根节点的...

php – 我应该使用哪个XML文件依赖元素(Magento)?【代码】

我们知道在Magento中有两个必要的XML文件用于模块开发. > Package_Module.xml> etc / config.xml 有些人使用< depends> (如果取决于任何现有模块)标记在第一个XML文件和&一些在第二档 2.)<modules><Company><NewProduct><version>0.7.32</version><depends><!-- no dependencies --></depends><NewProduct></Company> <modules>1.)<modules><(NameSpace_ModuleName)><active>[true|false]</active><codePool>[core|community|local...

c# – 使用LINQ to XML查询带有前缀命名空间的xml子元素【代码】

所以我有一些XML通常看起来像这样<wd:Data xmlns:wd="urn:com.foo.bar/GetResult"><wd:Result><wd:field1>lorem</wd:field1><wd:field2>ipsum</wd:field2><wd:field3>dolor</wd:field3><wd:field4>sit</wd:field4></wd:Result> </wd:Data>命名空间以“wd”为前缀 我希望能够在< wd:Result> …< / wd:Result>中获取每个元素.并创建一个新的KeyValuePair< string,string>其中键是元素名称,值是元素的值,如下所示: {“field1”,“l...

python – 覆盖lxml行为以写入Null标记的结束和打开元素【代码】

root = etree.Element('document') rootTree = etree.ElementTree(root) firstChild = etree.SubElement(root, 'test')输出是:<document> <test/> </document我希望输出为:<document> <test> </test> </document>我知道两者都是等价的但是有办法获得我想要的输出.解决方法:将tostring的方法参数设置为html.如:etree.tostring(root, method="html")参考:Close a tag with no text in lxml

命名空间:javax.xml.bind.UnmarshalException:意外元素【代码】

出于某种原因,我必须手动解析看起来像这样的KML文件:<?xml version="1.0" encoding="UTF-8"?> <kml xmlns="http://www.opengis.net/kml/2.2"><Document>...<Placemark><Point><coordinates>13.38705,52.52715,0</coordinates></Point><Name>My name</Name><description xmlns="">Hallo World</description></Placemark></Document> </kml>为了将它映射到java,我编写了以下类@XmlRootElement(name = "kml", namespace = "http://ww...

python – 根据属性值使用lxml对子元素进行排序【代码】

我正在尝试根据属性值对文档中的一些子元素进行排序,而实际排序的函数似乎正在工作,新的排序元素的拼接似乎不是.from lxml import etreedef getkey(elem):# Used for sorting elements by @LIN.# returns a tuple of ints from the exploded @LIN value# '1.0' -> (1,0)# '1.0.1' -> (1,0,1)return tuple([int(x) for x in elem.get('LIN').split('.')])xml_str = """<Interface><Header></Header><PurchaseOrder><LineItems><Line...

java – 从XML文档,XSLT和JAXB中删除元素【代码】

这个问题是我之前提出的问题的后续问题: and elements' rel='nofollow' target='_blank'>Creating a valid XSD that is open using and elements 鉴于我有一个包含以下形式的XML文档的Java String:<TRADE><TIME>12:12</TIME><MJELLO>12345</MJELLO><OPTIONAL>12:12</OPTIONAL><DATE>25-10-2011</DATE><HELLO>hello should be ignored</HELLO> </TRADE>我如何使用XSLT或类似的东西(在Java中使用JAXB)来删除一组元素中未包含的所...