首页 / XML / python-lxml element.clear()和访问子元素

python-lxml element.clear()和访问子元素

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-lxml element.clear()和访问子元素，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4020字，纯文字阅读大概需要6分钟。

内容图文

我正在使用lxml.iterparse来解析一个相当大的xml文件.在某个时刻会引发内存不足异常.我知道类似的问题,并且有一棵树,当您不再使用它时,通常应使用element.clear()清除它.

我的代码如下所示(缩短)：

for  event,element in context :
    if element.tag == xmlns + 'initialized':        
        attributes = element.findall(xmlns+'attribute')         
        heapsize = filter(lambda x:x.attrib['name']=='maxHeapSize', attributes)[0].attrib['value']
        characteristics['max_heap_size_MB'] = bytes_to_MB(int(heapsize, 16))

    #clear up the built tree to avoid mem alloc fails
    element.clear()
del context

如果我注释掉element.clear(),这将起作用.如果我使用element.clear,则会得到如下所示的Keyerrors：

Traceback (most recent call last):
  File "C:\Users\NN\Documents\scripts\analyse\analyse_all.py", line 289, in <module>
    main()
  File "C:\Users\NN\Documents\scripts\analyse\analyse_all.py", line 277, in main
    join_characteristics_and_score(logpath, benchmarkscores)
  File "C:\Users\NN\Documents\scripts\analyse\analyse_all.py", line 140, in join_characteristics_and_score
    parsed_verbose_xml  = parse_xml(verbose)
  File "C:\Users\NN\Documents\scripts\analyse\analyze_g.py", line 62, in parse_xml
    heapsize = filter(lambda x:x.attrib['name']=='maxHeapSize', attributes)[0].attrib['value']
  File "C:\Users\NN\Documents\scripts\analyse\analyze_g.py", line 62, in <lambda>
    heapsize = filter(lambda x:x.attrib['name']=='maxHeapSize', attributes)[0].attrib['value']
  File "lxml.etree.pyx", line 2272, in lxml.etree._Attrib.__getitem__ (src\lxml\lxml.etree.c:54751)
KeyError: 'name'

当我打印元素时,它们是带有值的常规字典,而不使用element.clear().清算时,这些格是空的.

编辑

一个最小的正在运行的python程序来说明问题：

#!/usr/bin/python

from lxml import etree
from pprint import pprint

def fast_iter(context, func, *args, **kwargs):
        # http://www.ibm.com/developerworks/xml/library/x-hiperfparse/
        # Author: Liza Daly
        for event, elem in context:
            func(elem, *args, **kwargs) 
            elem.clear()
            while elem.getprevious() is not None:
                del elem.getparent()[0]
        del context

def process_element(elem):
        xmlns = "{http://www.ibm.com/j9/verbosegc}"

        if elem.tag == xmlns + "gc-start":
            memelements = elem.findall('.//root:mem', namespaces = {'root':xmlns[1:-1]})
            pprint(memelements)

if __name__ == '__main__':
    with open('small.xml', "r+") as xmlf:
                context = etree.iterparse(xmlf)
                fast_iter(context, process_element)

xmlfile的内容如下：

<verbosegc xmlns="http://www.ibm.com/j9/verbosegc">
<gc-start id="5" type="scavenge" contextid="4" timestamp="2013-06-14T15:48:46.815">
  <mem-info id="6" free="3048240" total="4194304" percent="72">
    <mem type="nursery" free="0" total="1048576" percent="0">
      <mem type="allocate" free="0" total="524288" percent="0" />
      <mem type="survivor" free="0" total="524288" percent="0" />
    </mem>
    <mem type="tenure" free="3048240" total="3145728" percent="96">
      <mem type="soa" free="2891568" total="2989056" percent="96" />
      <mem type="loa" free="156672" total="156672" percent="100" />
    </mem>
    <remembered-set count="1593" />
  </mem-info>
</gc-start>
</verbosegc>

解决方法:

丽莎·戴利(Liza Daly)写了一篇很棒的有关processing large XML using lxml的文章.尝试那里提供的fast_iter代码：

import lxml.etree as ET
import pprint


def fast_iter(context, func, *args, **kwargs):
    """
    http://www.ibm.com/developerworks/xml/library/x-hiperfparse/ (Liza Daly)
    See also http://effbot.org/zone/element-iterparse.htm
    """
    for event, elem in context:
        func(elem, *args, **kwargs)
        # It's safe to call clear() here because no descendants will be
        # accessed
        elem.clear()
        # Also eliminate now-empty references from the root node to elem
        # (ancestor loop added by unutbu)
        for ancestor in elem.xpath('ancestor-or-self::*'):
            while ancestor.getprevious() is not None:
                del ancestor.getparent()[0]
    del context


def process_element(elem, namespaces):
    memelements = elem.findall('.//root:mem', namespaces=namespaces)
    pprint.pprint(memelements)

if __name__ == '__main__':
    xmlns = "http://www.ibm.com/j9/verbosegc"
    namespaces = {'root': xmlns}
    with open('small.xml', "r+") as xmlf:
        context = ET.iterparse(xmlf, events=('end', ),
                               tag='{{{}}}gc-start'.format(xmlns))
        fast_iter(context, process_element, namespaces)

内容总结

以上是互联网集市为您收集整理的python-lxml element.clear()和访问子元素全部内容，希望文章能够帮你解决python-lxml element.clear()和访问子元素所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/657147.html

来源：【匿名】

【上一篇】PHP从URL解析XML 【下一篇】PHP和JAVA的XML-RPC中文问题解决办法

更多 ►

【python-lxml element.clear()和访问子元素】教程文章相关的互联网学习教程文章

web.xml 中元素加载顺序及其详解【代码】

一、概述1、启动一个WEB项目的时候，WEB容器会去读取它的配置文件web.xml，读取<listener>和<context-param>两个结点。2、紧接着，容器创建一个ServletContext（servlet上下文），这个web项目的所有部分都将共享这个上下文。3、容器将<context-param>转换为键值对，并交给servletContext。4、容器创建<listener>中的类实例，创建监听器二、 load-on-startupload-on-startup 元素在web应用启动的时候指定了servlet被加载的顺序，它...

关于操作XML元素属性的详细介绍【图】

jscript与vbscript 操作XML元素属性的代码，需要的朋友可以参考下。Although attributes belong to a particular element, they are not considered child nodes of element nodes. Instead, they behave more like properties of IXMLDOMElement. Most of the methods for working with&nbs1. 分享一个jscript与vbscript操作XML元素属性的方法简介：jscript与vbscript 操作XML元素属性的代码，需要的朋友可以参考下。2. jscript和...

详细解读PHP解析XML元素结构的代码示例_PHP教程

PHP解析XML元素结构的代码： < ?php $file = "data.xml"; $depth = array(); function startElement ($parser, $name, $attrs) { global $depth; for ($i = 0; $i < $depth [$parser]; $i++) { print " "; } print "$namen"; $depth[$parser]++; } function endElement($parser, $name) { global $depth; $depth[$parser]--; } $xml_parser ...

php操作xml入门之xml基本介绍及xml标签元素，xml标签_PHP教程

php操作xml入门之xml基本介绍及xml标签元素，xml标签本文实例讲述了php操作xml入门之xml基本介绍及xml标签元素。分享给大家供大家参考。具体分析如下：以xml实例来讲解：代码如下:<?xml version="1.0" encoding="utf-8" standalone="no" ?> 小乔女23周瑜男27一、xml声明： <?xml version="1.0" encoding="utf-8" standalone="no" ?> （1）、xml声明要放在文档的第一行；（2）、encoding：文档字符编码，如utf-8、gb2312等。（...

php操作xml入门之xml基本介绍及xml标签元素_PHP教程

php操作xml入门之xml基本介绍及xml标签元素以xml实例来讲解：代码如下:小乔女 23周瑜男 27一、xml声明：（1）、xml声明要放在文档的第一行；（2）、encoding：文档字符编码，如utf-8、gb2312等。（3）、standalone：值为yes或者no，可有可无，表示文档定义是否独立，即与其它文档是否有关联。默认为no。二、根元素包在最外层的为根元素，每个 xml 文档都必须有且只能有一个根元素。三、xml 元素/标签/节点、、、等都是xm...

怎么能知道XML对象中有几个一层的元素simplexml_load_file()

比如：simplexml_load_file() 后用var_dump（）显示如下：怎么能知道xml中包含几个page ？下例中page是2个，一个[0]，一个[1]. object(SimpleXMLElement)#24 (1) { ["page"]=> array(2) { [0]=> object(SimpleXMLElement)#25 (2) { ["@attributes"]=> array(1) { ["id"]=> string(1) "0" } ["background"]=> object(SimpleXMLElement)#38 (1) { ["@attributes"]=> array(1) { ...

php怎么修改xml元素名称

$v="abc"; $note"->item(0)->getElementsByTagName("name")->item(0)->nodeName=$v;//把名称为name修改成$v,但nodeName只读,这样不行是不是会有修改的方法,比如xml元素属性,或值都是可以修改,为什么名称却不能修改回复讨论(解决方案) 插入新节点，删除老节点但在原标签内有很多字节点,要怎么获取内容插入新节点类似js在html内可以这样,获取所...

如何能知道XML对象中有几个一层的元素simplexml_load_file()

怎么能知道XML对象中有几个一层的元素 simplexml_load_file()比如：simplexml_load_file() 后用var_dump（）显示如下：怎么能知道xml中包含几个page ？下例中page是2个，一个[0]，一个[1]. object(SimpleXMLElement)#24 (1) { ["page"]=> array(2) { [0]=> object(SimpleXMLElement)#25 (2) { ["@attributes"]=> array(1) { ["id"]=> string(1) "0" } ["background"]=> object(SimpleXMLElement)#38 (1) { ["@attributes"]=> ar...

PHP解析XML元素结构范例_PHP

该范例用缩进格式显示一个文档中起始元素的结构。　　显示 XML 元素结构$file = "data.xml";$depth = array();function startElement($parser, $name, $attrs) { global $depth; for ($i = 0; $i print " "; } print "$name\n"; $depth[$parser] ;}function endElement($parser, $name) { global $depth; $depth[$parser]--;}$xml_parser = xml_parser_create();xml_set_element_handler($xml_parser, "st...

php操作xml入门之xml基本介绍及xml标签元素_PHP

本文实例讲述了php操作xml入门之xml基本介绍及xml标签元素。分享给大家供大家参考。具体分析如下：以xml实例来讲解：代码如下:<?xml version="1.0" encoding="utf-8" standalone="no" ?> 小乔女23周瑜男27一、xml声明： <?xml version="1.0" encoding="utf-8" standalone="no" ?> （1）、xml声明要放在文档的第一行；（2）、encoding：文档字符编码，如utf-8、gb2312等。（3）、standalone：值为yes或者no，可有可无，表示文档...

php读取xml中某个元素的内容(PHP5以上才支持)

假设xml文件名为class.xml，内容如下：3　　张三　　　　 5　　李四　 1、载入xml文件并生成一个simpleXml对象 //假设xml文件在当前路径 $xml = simplexml_load_file(’class.xml’); 2、根据元素的名字，一层一层找到那个元素，并获取元素内容 //假设获取的是第二个student中的子元素中，第一个name的内容，也就是输出李四。注意元素的索引从0开始 echo $xml->student[1]->name[0];

php操作xml入门之xml基本介绍及xml标签元素_php技巧

php操作xml入门之xml基本介绍及xml标签元素

本文实例讲述了php操作xml入门之xml基本介绍及xml标签元素。分享给大家供大家参考。具体分析如下：以xml实例来讲解：代码如下:<?xml version="1.0" encoding="utf-8" standalone="no" ?> <class> <student> <name>小乔</name> <sex>女</sex> <age>23</age> </student> <student> <name>周瑜</name> <sex>男</sex> <age>27</age> </student> </class> 一、xml声明： <?xml version="1.0" encoding="utf-8" standal...

jQuery在IE下使用未闭合的xml代码创建元素时的Bug介绍_jquery

先初始化两个变量, 请注意其细微差别: 代码如下: var a=$(); var b=$(); // 不能单单使用$(), 因为jQuery对之进行了优化代码如下: typeof a[0]; // object typeof b[0]; // object IE(6|7|8)下的表现: 代码如下: typeof a[0]; // undefined typeof b[0]; // object 需要注意的是, 在IE(6|7|8)下, a仅仅比b缺失了[0]这一个对象成员. 我已向官方提交了此Bug, 在未得到Fix之前, 还是老老实实加上反斜杠吧.

处理及遍历XML文档DOM元素属性及方法整理_基础知识

用于处理XML文档的DOM元素属性代码如下: childNodes：返回当前元素所有子元素的数组； firstChild：返回当前元素的第一个下级子元素； lastChild：返回当前元素的最后一个子元素； nextSibling：返回紧跟在当前元素后面的元素； noedValue：指定表示元素值的读/写属性； parentNode：返回元素的父节点； previousSibling：返回紧邻当前元素之前的元素；用于遍历XML文档的DOM元素方法代码如下: getElementById(id)(document)：...

XML - 最热教程

基于DOM4j和POI实现的XML文件转换为XLS...php+mysql+xml实现的问卷调查（代码）XMLHttpRequest中responseText如何获取...C# XELEMENT 解析xml文件(字符串)Maven 项目之pom.xml 提示Unknow Error Android中序列化对象到XMl 和 XML反序列...用Java将XML文档保存在数据库中(Hibern...c# – 如何更新XML节点？解决java.lang.ClassNotFoundException...php – 通过SimpleXMLElement循环访问属...

首页 / XML / python-lxml element.clear()和访问子元素

python-lxml element.clear()和访问子元素

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-lxml element.clear()和访问子元素】教程文章相关的互联网学习教程文章

web.xml 中元素加载顺序及其详解【代码】

关于操作XML元素属性的详细介绍【图】

详细解读PHP解析XML元素结构的代码示例_PHP教程

php操作xml入门之xml基本介绍及xml标签元素，xml标签_PHP教程

php操作xml入门之xml基本介绍及xml标签元素_PHP教程

怎么能知道XML对象中有几个一层的元素simplexml_load_file()

php怎么修改xml元素名称

如何能知道XML对象中有几个一层的元素simplexml_load_file()

PHP解析XML元素结构范例_PHP

php操作xml入门之xml基本介绍及xml标签元素_PHP

php读取xml中某个元素的内容(PHP5以上才支持)

php操作xml入门之xml基本介绍及xml标签元素_php技巧

php操作xml入门之xml基本介绍及xml标签元素

jQuery在IE下使用未闭合的xml代码创建元素时的Bug介绍_jquery

处理及遍历XML文档DOM元素属性及方法整理_基础知识

PYTHON - 相关标签

XML - 相关标签

XML - 最新教程

XML - 最热教程