python – 通过lxml.etree.iterparse在单个文件中解析多个XML声明
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python – 通过lxml.etree.iterparse在单个文件中解析多个XML声明,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1087字,纯文字阅读大概需要2分钟。
内容图文
我需要解析包含各种XML文件的文件,即< xml>< / xml> < XML>< / XML> ……等等.使用etree.iterparse时,我得到以下(正确)错误:
lxml.etree.XMLSyntaxError: XML declaration allowed only at the start of the document
现在,我可以预处理输入文件,并为每个包含的XML文件生成一个单独的文件.这可能是最简单的解决方案.但我想知道是否存在适当的解决方案.
谢谢!
解决方法:
您提供的示例数据表明存在一个问题,而您提供的问题和例外表明存在另一个问题.您是否将多个XML文档连接在一起,每个文档都有自己的XML声明,或者您是否有一个包含多个顶级元素的XML片段?
如果它是前者,则解决方案将涉及将输入流分解为多个流,并逐个解析每个流.正如一条评论所暗示的那样,这并不一定意味着实现XML解析器.您可以在字符串中搜索XML声明,而不必解析其中的任何其他内容,只要您的输入不包含包含未转义的XML声明的CDATA部分即可.您可以编写一个类似文件的对象,该对象返回基础流中的字符,直到它到达XML声明,然后将其包装在生成器函数中,该函数将一直保持返回流,直到达到EOF.这不是微不足道的,但也不是很难.
如果你有一个包含多个顶级元素的XML片段,你可以将它们包装成一个XML元素并解析整个元素.
当然,与大多数涉及错误XML输入的问题一样,最简单的解决方案可能只是解决产生错误输入的问题.
内容总结
以上是互联网集市为您收集整理的python – 通过lxml.etree.iterparse在单个文件中解析多个XML声明全部内容,希望文章能够帮你解决python – 通过lxml.etree.iterparse在单个文件中解析多个XML声明所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。