首页 / XML / 使用Python的xml.etree查找元素开始和结束字符偏移量

使用Python的xml.etree查找元素开始和结束字符偏移量

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用Python的xml.etree查找元素开始和结束字符偏移量，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1638字，纯文字阅读大概需要3分钟。

内容图文

我有XML数据,看起来像：

<xml>
The captial of <place pid="1">South Africa</place> is <place>Pretoria</place>.
</xml>

我希望能够提取：

>目前在etree中提供的XML元素.
>文档的完整纯文本,在开始和结束标记之间.
>每个开始元素的纯文本中的位置,作为字符偏移量.

(3)是目前最重要的要求; etree提供(1)罚款.

我无法直接看到任何方法(3),但希望迭代文档树中的元素将返回许多可以重新组装的小字符串,从而提供(2)和(3).但是,请求根节点的.text仅返回根节点和第一个元素之间的文本,例如, “的首都 ”.

使用SAX执行(1)可能涉及实施已经多次写入的批次,例如, minidom和etree.使用lxml不是此代码所涉及的包的选项.有人可以帮忙吗？

解决方法:

iterparse()函数在xml.etree中可用：

import xml.etree.cElementTree as etree

for event, elem in etree.iterparse(file, events=('start', 'end')):
    if event == 'start':
       print(elem.tag) # use only tag name and attributes here
    elif event == 'end':
       # elem children elements, elem.text, elem.tail are available
       if elem.text is not None and elem.tail is not None:
          print(repr(elem.tail))

另一种选择是覆盖etree.TreeBuilder()的start(),data(),end()方法：

from xml.etree.ElementTree import XMLParser, TreeBuilder

class MyTreeBuilder(TreeBuilder):

    def start(self, tag, attrs):
        print("&lt;%s>" % tag)
        return TreeBuilder.start(self, tag, attrs)

    def data(self, data):
        print(repr(data))
        TreeBuilder.data(self, data)

    def end(self, tag):
        return TreeBuilder.end(self, tag)

text = """<xml>
The captial of <place pid="1">South Africa</place> is <place>Pretoria</place>.
</xml>"""

# ElementTree.fromstring()
parser = XMLParser(target=MyTreeBuilder())
parser.feed(text)
root = parser.close() # return an ordinary Element

产量

<xml>
'\nThe captial of '
<place>
'South Africa'
' is '
<place>
'Pretoria'
'.\n'

内容总结

以上是互联网集市为您收集整理的使用Python的xml.etree查找元素开始和结束字符偏移量全部内容，希望文章能够帮你解决使用Python的xml.etree查找元素开始和结束字符偏移量所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/798444.html

来源：【匿名】

【上一篇】java – 如何解密jboss login-config.xml中的密码？【下一篇】PHP和JAVA的XML-RPC中文问题解决办法

更多 ►

【使用Python的xml.etree查找元素开始和结束字符偏移量】教程文章相关的互联网学习教程文章

web项目中的web.xml元素解析

1 定义头和根元素　　部署描述符文件就像所有XML文件一样，必须以一个XML头开始。这个头声明可以使用的XML版本并给出文件的字符编码。DOCYTPE声明必须立即出现在此头之后。这个声明告诉服务器适用的servlet规范的版本（如2.2或2.3）并指定管理此文件其余部分内容的语法的DTD(Document Type Definition，文档类型定义)。所有部署描述符文件的顶层（根）元素为web-app。请注意，XML元素不像HTML，他们是大小写敏感的。因此，web-App和...

关于spring-mvc.xml的mvc:resources元素浅析。

配置如下：<mvc:resources location="/static/" mapping="/static/**" /> 说明：location元素表示webapp目录下的static包下的所有文件；mapping元素表示以/static开头的所有请求路径，如/static/a 或者/static/a/b；该配置的作用是：DispatcherServlet不会拦截以/static开头的所有请求路径，并当作静态资源交由Servlet处理。原文：http://www.cnblogs.com/soundcode/p/6444018.html

jscript与vbscript 操作XML元素属性的代码

Although attributes belong to a particular element, they are not considered child nodes of element nodes. Instead, they behave more like properties of IXMLDOMElement. Most of the methods for working with attributes come from IXMLDOMElement. Attributes can be manipulated in the following ways. Directly, through the getAttribute and setAttribute methods of IXMLDOMElement. As named IXMLDOMAttribute n...

DataTable读写到XML文件的正确方法（以及对缺少根元素问题的处理）

有时候需要将DataTable数据保存到xml文件中，在不使用数据库的小程序中、在需要通过网络接口传参数时，经常会有这种需要，操作不好，会出现“缺少根元素”。现在将经过反复测试没有错误的读写两个方法写出来，大家可以修改使用。写datatable到XML public static bool dataTable2EncXml(DataTable dt, string strFilePath) { try { string strMid = "";...

web.xml 中元素加载顺序及其详解【代码】

一、概述1、启动一个WEB项目的时候，WEB容器会去读取它的配置文件web.xml，读取<listener>和<context-param>两个结点。2、紧接着，容器创建一个ServletContext（servlet上下文），这个web项目的所有部分都将共享这个上下文。3、容器将<context-param>转换为键值对，并交给servletContext。4、容器创建<listener>中的类实例，创建监听器二、 load-on-startupload-on-startup 元素在web应用启动的时候指定了servlet被加载的顺序，它...

关于操作XML元素属性的详细介绍【图】

jscript与vbscript 操作XML元素属性的代码，需要的朋友可以参考下。Although attributes belong to a particular element, they are not considered child nodes of element nodes. Instead, they behave more like properties of IXMLDOMElement. Most of the methods for working with&nbs1. 分享一个jscript与vbscript操作XML元素属性的方法简介：jscript与vbscript 操作XML元素属性的代码，需要的朋友可以参考下。2. jscript和...

详细解读PHP解析XML元素结构的代码示例_PHP教程

PHP解析XML元素结构的代码： < ?php $file = "data.xml"; $depth = array(); function startElement ($parser, $name, $attrs) { global $depth; for ($i = 0; $i < $depth [$parser]; $i++) { print " "; } print "$namen"; $depth[$parser]++; } function endElement($parser, $name) { global $depth; $depth[$parser]--; } $xml_parser ...

php操作xml入门之xml基本介绍及xml标签元素，xml标签_PHP教程

php操作xml入门之xml基本介绍及xml标签元素，xml标签本文实例讲述了php操作xml入门之xml基本介绍及xml标签元素。分享给大家供大家参考。具体分析如下：以xml实例来讲解：代码如下:<?xml version="1.0" encoding="utf-8" standalone="no" ?> 小乔女23周瑜男27一、xml声明： <?xml version="1.0" encoding="utf-8" standalone="no" ?> （1）、xml声明要放在文档的第一行；（2）、encoding：文档字符编码，如utf-8、gb2312等。（...

php操作xml入门之xml基本介绍及xml标签元素_PHP教程

php操作xml入门之xml基本介绍及xml标签元素以xml实例来讲解：代码如下:小乔女 23周瑜男 27一、xml声明：（1）、xml声明要放在文档的第一行；（2）、encoding：文档字符编码，如utf-8、gb2312等。（3）、standalone：值为yes或者no，可有可无，表示文档定义是否独立，即与其它文档是否有关联。默认为no。二、根元素包在最外层的为根元素，每个 xml 文档都必须有且只能有一个根元素。三、xml 元素/标签/节点、、、等都是xm...

怎么能知道XML对象中有几个一层的元素simplexml_load_file()

比如：simplexml_load_file() 后用var_dump（）显示如下：怎么能知道xml中包含几个page ？下例中page是2个，一个[0]，一个[1]. object(SimpleXMLElement)#24 (1) { ["page"]=> array(2) { [0]=> object(SimpleXMLElement)#25 (2) { ["@attributes"]=> array(1) { ["id"]=> string(1) "0" } ["background"]=> object(SimpleXMLElement)#38 (1) { ["@attributes"]=> array(1) { ...

php怎么修改xml元素名称

$v="abc"; $note"->item(0)->getElementsByTagName("name")->item(0)->nodeName=$v;//把名称为name修改成$v,但nodeName只读,这样不行是不是会有修改的方法,比如xml元素属性,或值都是可以修改,为什么名称却不能修改回复讨论(解决方案) 插入新节点，删除老节点但在原标签内有很多字节点,要怎么获取内容插入新节点类似js在html内可以这样,获取所...

如何能知道XML对象中有几个一层的元素simplexml_load_file()

怎么能知道XML对象中有几个一层的元素 simplexml_load_file()比如：simplexml_load_file() 后用var_dump（）显示如下：怎么能知道xml中包含几个page ？下例中page是2个，一个[0]，一个[1]. object(SimpleXMLElement)#24 (1) { ["page"]=> array(2) { [0]=> object(SimpleXMLElement)#25 (2) { ["@attributes"]=> array(1) { ["id"]=> string(1) "0" } ["background"]=> object(SimpleXMLElement)#38 (1) { ["@attributes"]=> ar...

PHP解析XML元素结构范例_PHP

该范例用缩进格式显示一个文档中起始元素的结构。　　显示 XML 元素结构$file = "data.xml";$depth = array();function startElement($parser, $name, $attrs) { global $depth; for ($i = 0; $i print " "; } print "$name\n"; $depth[$parser] ;}function endElement($parser, $name) { global $depth; $depth[$parser]--;}$xml_parser = xml_parser_create();xml_set_element_handler($xml_parser, "st...

php操作xml入门之xml基本介绍及xml标签元素_PHP

本文实例讲述了php操作xml入门之xml基本介绍及xml标签元素。分享给大家供大家参考。具体分析如下：以xml实例来讲解：代码如下:<?xml version="1.0" encoding="utf-8" standalone="no" ?> 小乔女23周瑜男27一、xml声明： <?xml version="1.0" encoding="utf-8" standalone="no" ?> （1）、xml声明要放在文档的第一行；（2）、encoding：文档字符编码，如utf-8、gb2312等。（3）、standalone：值为yes或者no，可有可无，表示文档...

php读取xml中某个元素的内容(PHP5以上才支持)

假设xml文件名为class.xml，内容如下：3　　张三　　　　 5　　李四　 1、载入xml文件并生成一个simpleXml对象 //假设xml文件在当前路径 $xml = simplexml_load_file(’class.xml’); 2、根据元素的名字，一层一层找到那个元素，并获取元素内容 //假设获取的是第二个student中的子元素中，第一个name的内容，也就是输出李四。注意元素的索引从0开始 echo $xml->student[1]->name[0];

XML - 最热教程

基于DOM4j和POI实现的XML文件转换为XLS...php+mysql+xml实现的问卷调查（代码）XMLHttpRequest中responseText如何获取...C# XELEMENT 解析xml文件(字符串)Maven 项目之pom.xml 提示Unknow Error Android中序列化对象到XMl 和 XML反序列...用Java将XML文档保存在数据库中(Hibern...c# – 如何更新XML节点？解决java.lang.ClassNotFoundException...php – 通过SimpleXMLElement循环访问属...

首页 / XML / 使用Python的xml.etree查找元素开始和结束字符偏移量

使用Python的xml.etree查找元素开始和结束字符偏移量

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用Python的xml.etree查找元素开始和结束字符偏移量】教程文章相关的互联网学习教程文章

web项目中的web.xml元素解析

关于spring-mvc.xml的mvc:resources元素浅析。

jscript与vbscript 操作XML元素属性的代码

DataTable读写到XML文件的正确方法（以及对缺少根元素问题的处理）

web.xml 中元素加载顺序及其详解【代码】

关于操作XML元素属性的详细介绍【图】

详细解读PHP解析XML元素结构的代码示例_PHP教程

php操作xml入门之xml基本介绍及xml标签元素，xml标签_PHP教程

php操作xml入门之xml基本介绍及xml标签元素_PHP教程

怎么能知道XML对象中有几个一层的元素simplexml_load_file()

php怎么修改xml元素名称

如何能知道XML对象中有几个一层的元素simplexml_load_file()

PHP解析XML元素结构范例_PHP

php操作xml入门之xml基本介绍及xml标签元素_PHP

php读取xml中某个元素的内容(PHP5以上才支持)

PYTHON - 相关标签

TREE - 相关标签

XML - 相关标签

XML - 最新教程

XML - 最热教程