首页 / PYTHON / python-ElementTree iterparse应该花多长时间？

python-ElementTree iterparse应该花多长时间？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-ElementTree iterparse应该花多长时间？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1304字，纯文字阅读大概需要2分钟。

内容图文

在回答另一个问题时,有人向我展示了以下教程,作者声称其中使用了iterparse在3秒内解析了约100 MB的XML文件：

http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python-with-elementtree/

我正在尝试解析约90 MB的XML文件,并且我有以下代码：

from xml.etree.cElementTree import *
count = 0

for event, elem in iterparse('foo.xml'):        
    if elem.tag == 'identifier' and elem.text == 'bar':
        count += 1
    elem.clear() # discard the element

print count

这大约需要30秒钟的时间……甚至与我在使用大小相似,算法和封装相同的文件中阅读的教程所报告的数量级都不一样.

有人可以告诉我我的代码可能有什么问题,或者情况和教程之间可能没有引起我注意的区别吗？

我正在使用Python 2.7.3.

附录：

我还使用了功能相当强大的机器,以防万一有人认为是这样.

解决方法:

正如TJD所提到的,仅比较XML的大小可能不会提供很多信息.但是,我碰巧具有相同结构但大小不同的文件：

带有79M文件：

$python -m timeit -n 1 -c 'from xml.etree.cElementTree import iterparse
count = 0
for event, elem in iterparse("..../QT20060217_S_18mix23-2500_01.mzML"):
    if elem.tag.endswith("spectrum"): count += 1
    elem.clear()
print count'
6126
6126
6126
1 loops, best of 3: 950 msec per loop

对于3.8G文件,timeit输出为：

1 loops, best of 3: 22.3 sec per loop

另外,与lxml进行比较：将第一行中的xml.etree.cElementTree更改为lxml.etree,我得到：

对于第一个文件：每个循环730毫秒

对于第二个文件：每个循环11.4秒

内容总结

以上是互联网集市为您收集整理的python-ElementTree iterparse应该花多长时间？全部内容，希望文章能够帮你解决python-ElementTree iterparse应该花多长时间？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/674537.html

来源：【匿名】

【上一篇】python脚本忽略文件中的换行符【下一篇】浅谈PHP运行Python脚本的方法

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python-ElementTree iterparse应该花多长时间？

python-ElementTree iterparse应该花多长时间？

内容导读

内容图文

内容总结

内容备注

内容手机端

PYTHON - 相关标签

TREE - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程