首页 / XML / Python XML 解析

Python XML 解析

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python XML 解析，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含7399字，纯文字阅读大概需要11分钟。

内容图文

Python XML 解析

什么是 XML？

XML 指可扩展标记语言（eXtensible Markup Language）。你可以通过本站学习 XML 教程

XML 被设计用来传输和存储数据。

XML 是一套定义语义标记的规则，这些标记将文档分成许多部件并对这些部件加以标识。

它也是元标记语言，即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。

Python 对 XML 的解析

常见的 XML 编程接口有 DOM 和 SAX，这两种接口处理 XML 文件的方式不同，当然使用场合也不同。

Python 有三种方法解析 XML，SAX，DOM，以及 ElementTree:

1.SAX (simple API for XML )

Python 标准库包含 SAX 解析器，SAX 用事件驱动模型，通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。

2.DOM(Document Object Model)

将 XML 数据在内存中解析成一个树，通过对树的操作来操作XML。

3.ElementTree(元素树)

ElementTree就像一个轻量级的DOM，具有方便友好的API。代码可用性好，速度快，消耗内存少。

注：因DOM需要将XML数据映射到内存中的树，一是比较慢，二是比较耗内存，而SAX流式读取XML文件，比较快，占用内存少，但需要用户实现回调函数（handler）。

本章节使用到的 XML 实例文件 movies.xml 内容如下：

movies.xml

<collection?shelf="New Arrivals">?<movie?title="Enemy Behind">?<type>War, Thriller</type>?<format>DVD</format>?<year>2003</year>?<rating>PG</rating>?<stars>10</stars>?<description>Talk about a US-Japan war</description>?</movie>?<movie?title="Transformers">?<type>Anime, Science Fiction</type>?<format>DVD</format>?<year>1989</year>?<rating>R</rating>?<stars>8</stars>?<description>A schientific fiction</description>?</movie>?<movie?title="Trigun">?<type>Anime, Action</type>?<format>DVD</format>?<episodes>4</episodes>?<rating>PG</rating>?<stars>10</stars>?<description>Vash the Stampede!</description>?</movie>?<movie?title="Ishtar">?<type>Comedy</type>?<format>VHS</format>?<rating>PG</rating>?<stars>2</stars>?<description>Viewable boredom</description>?</movie>?</collection>

python使用SAX解析xml

SAX是一种基于事件驱动的 API。

利用SAX解析XML文档牵涉到两个部分: 解析器和事件处理器。

解析器负责读取XML文档，并向事件处理器发送事件，如元素开始跟元素结束事件。

而事件处理器则负责对事件作出响应，对传递的XML数据进行处理。

<psax适于处理下面的问题：< p="">

1、对大型文件进行处理；
2、只需要文件的部分内容，或者只需从文件中得到特定信息。
3、想建立自己的对象模型的时候。

在python中使用sax方式处理xml要先引入xml.sax中的parse函数，还有xml.sax.handler中的ContentHandler。

ContentHandler类方法介绍

characters(content)方法

调用时机：

从行开始，遇到标签之前，存在字符，content 的值为这些字符串。

从一个标签，遇到下一个标签之前，存在字符，content 的值为这些字符串。

从一个标签，遇到行结束符之前，存在字符，content 的值为这些字符串。

标签可以是开始标签，也可以是结束标签。

startDocument() 方法

文档启动的时候调用。

endDocument() 方法

解析器到达文档结尾时调用。

startElement(name, attrs)方法

遇到XML开始标签时调用，name是标签的名字，attrs是标签的属性值字典。

endElement(name) 方法

遇到XML结束标签时调用。

make_parser方法

以下方法创建一个新的解析器对象并返回。

xml.sax.make_parser( [parser_list] )

参数说明:

parser_list - 可选参数，解析器列表

parser方法

以下方法创建一个 SAX 解析器并解析xml文档：

xml.sax.parse( xmlfile, contenthandler[, errorhandler])

参数说明:

xmlfile - xml文件名
contenthandler - 必须是一个ContentHandler的对象
errorhandler - 如果指定该参数，errorhandler必须是一个SAX ErrorHandler对象

parseString方法

parseString方法创建一个XML解析器并解析xml字符串：

xml.sax.parseString(xmlstring, contenthandler[, errorhandler])

参数说明:

xmlstring - xml字符串
contenthandler - 必须是一个ContentHandler的对象
errorhandler - 如果指定该参数，errorhandler必须是一个SAX ErrorHandler对象

Python 解析XML实例

实例

#!/usr/bin/python?# -*- coding: UTF-8 -*-?import?xml.sax?class?MovieHandler(?xml.sax.ContentHandler?):?def?__init__(self):?self.CurrentData?=?""?self.type?=?""?self.format?=?""?self.year?=?""?self.rating?=?""?self.stars?=?""?self.description?=?""?# 元素开始事件处理?def?startElement(self,?tag,?attributes):?self.CurrentData?=?tag?if?tag?==?"movie":?print?"*****Movie*****"?title?=?attributes["title"]?print?"Title:",?title?# 元素结束事件处理?def?endElement(self,?tag):?if?self.CurrentData?==?"type":?print?"Type:",?self.type?elif?self.CurrentData?==?"format":?print?"Format:",?self.format?elif?self.CurrentData?==?"year":?print?"Year:",?self.year?elif?self.CurrentData?==?"rating":?print?"Rating:",?self.rating?elif?self.CurrentData?==?"stars":?print?"Stars:",?self.stars?elif?self.CurrentData?==?"description":?print?"Description:",?self.description?self.CurrentData?=?""?# 内容事件处理?def?characters(self,?content):?if?self.CurrentData?==?"type":?self.type?=?content?elif?self.CurrentData?==?"format":?self.format?=?content?elif?self.CurrentData?==?"year":?self.year?=?content?elif?self.CurrentData?==?"rating":?self.rating?=?content?elif?self.CurrentData?==?"stars":?self.stars?=?content?elif?self.CurrentData?==?"description":?self.description?=?content?if?(?__name__?==?"__main__"):?# 创建一个 XMLReader?parser?=?xml.sax.make_parser()?# turn off namepsaces?parser.setFeature(xml.sax.handler.feature_namespaces,?0)?# 重写 ContextHandler?Handler?=?MovieHandler()?parser.setContentHandler(?Handler?)?parser.parse("movies.xml")

以上代码执行结果如下：

*****Movie*****
Title: Enemy Behind
Type: War, Thriller
Format: DVD
Year: 2003
Rating: PG
Stars: 10
Description: Talk about a US-Japan war
*****Movie*****
Title: Transformers
Type: Anime, Science Fiction
Format: DVD
Year: 1989
Rating: R
Stars: 8
Description: A schientific fiction
*****Movie*****
Title: Trigun
Type: Anime, Action
Format: DVD
Rating: PG
Stars: 10
Description: Vash the Stampede!
*****Movie*****
Title: Ishtar
Type: Comedy
Format: VHS
Rating: PG
Stars: 2
Description: Viewable boredom

完整的 SAX API 文档请查阅Python SAX APIs

使用xml.dom解析xml

文件对象模型（Document Object Model，简称DOM），是W3C组织推荐的处理可扩展置标语言的标准编程接口。

一个 DOM 的解析器在解析一个 XML 文档时，一次性读取整个文档，把文档中所有元素保存在内存中的一个树结构里，之后你可以利用DOM 提供的不同的函数来读取或修改文档的内容和结构，也可以把修改过的内容写入xml文件。

python中用xml.dom.minidom来解析xml文件，实例如下：

实例

#!/usr/bin/python?# -*- coding: UTF-8 -*-?from?xml.dom.minidom?import?parse?import?xml.dom.minidom?# 使用minidom解析器打开 XML 文档?DOMTree?=?xml.dom.minidom.parse("movies.xml")?collection?=?DOMTree.documentElement?if?collection.hasAttribute("shelf"):?print?"Root element : %s"?%?collection.getAttribute("shelf")?# 在集合中获取所有电影?movies?=?collection.getElementsByTagName("movie")?# 打印每部电影的详细信息?for?movie?in?movies:?print?"*****Movie*****"?if?movie.hasAttribute("title"):?print?"Title: %s"?%?movie.getAttribute("title")?type?=?movie.getElementsByTagName('type')[0]?print?"Type: %s"?%?type.childNodes[0].data?format?=?movie.getElementsByTagName('format')[0]?print?"Format: %s"?%?format.childNodes[0].data?rating?=?movie.getElementsByTagName('rating')[0]?print?"Rating: %s"?%?rating.childNodes[0].data?description?=?movie.getElementsByTagName('description')[0]?print?"Description: %s"?%?description.childNodes[0].data

以上程序执行结果如下：

Root element : New Arrivals
*****Movie*****
Title: Enemy Behind
Type: War, Thriller
Format: DVD
Rating: PG
Description: Talk about a US-Japan war
*****Movie*****
Title: Transformers
Type: Anime, Science Fiction
Format: DVD
Rating: R
Description: A schientific fiction
*****Movie*****
Title: Trigun
Type: Anime, Action
Format: DVD
Rating: PG
Description: Vash the Stampede!
*****Movie*****
Title: Ishtar
Type: Comedy
Format: VHS
Rating: PG
Description: Viewable boredom

完整的 DOM API 文档请查阅Python DOM APIs。

内容总结

以上是互联网集市为您收集整理的Python XML 解析全部内容，希望文章能够帮你解决Python XML 解析所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/683892.html

来源：【匿名】

【上一篇】Java-内联列表中具有属性的SimpleXML单深度元素【下一篇】PHP和JAVA的XML-RPC中文问题解决办法

更多 ►

【Python XML 解析】教程文章相关的互联网学习教程文章

XML、JSON数据结构解析

一、XML的解析XML的解析分为SAX解析和DOM解析，DOM解析又分为根节点解析和叶子节点解析。1.SAX解析步骤a.获取XML数据存储的文件路径(假如XML文件为Students.xml) NSString *filePath = [[NSBundle mainBundle]pathForResource:@"Students" ofType:@"xml"]; b.创建解析对象 //创建二进制数据对象 NSData *data = [NSData dataWithContentsOfFile:filePath]; NSXMLParser *parser = [[NSXMLParser alloc]initWithData:da...

springMVC初探视图解析器——XmlViewResolver【图】

XmlViewResolver解析器XmlViewResolver基于XML文件中的视图bean来解析“逻辑视图”。XmlViewResolver默认会从/WEB-INF/views.xml中加载视图bean，当然你也可以自己设置该xml文件的位置，该解析器有个属性“location”可设置xml位置当处理器返回“逻辑视图”(假设返回”jsonview“)时，解析器XmlViewResolver会在对应的views.xml文件中寻找Id为jsonview的Bean，如果找到就处理。views.xml中的配置如图：处理类：前台页面显示：注意...

Delphi之通过代码示例学习XML解析【代码】【图】

这个程序可以用于解析任何合法的XML字符串。首先是看一下程序的运行效果：　　　　　　　　　　　　　　以解析这样一个XML的字符串为例：<?xml version="1.0" encoding="UTF-8"?><BookInfo><Owner><OwnerName>张三</OwnerName><OwnerAge>1234</OwnerAge></Owner><BookMes><BookName>时间简史</BookName><ISDN>234343453534</ISDN><Writer>霍金</Writer></BookMes></BookInfo>　　首先是打开应用程序　　然后将上面所示的字符串复制...

iOS 网络数据之XML解析【代码】

<pre name="code" class="objc"><address> </address>向服务器请求数据，那么数据必须以某个特定的格式存放，然后一方把数据按这种格式组织起来，另一方按相同的方式把数据解析数来，就像是我们人之间讲话交流，我们的话...

[Python]HTML/XML解析器Beautiful Soup

【简介】Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。即HTML/XMLX的解析器。它可以很好的处理不规范标记并生成剖析树(parse tree)。它提供简单又常用的导航（navigating），搜索以及修改剖析树的操作。它可以大大节省你的编程时间。【安装】下载地址：点击打开链接Linux平台安装：如果你用的是新版的Debain或ubuntu,那么可以通过系统的软件包管理来安装:$ apt-get install Python-bs4Beautiful Soup 4 通过P...

03-IOSCore - XML及解析、Plist【代码】【图】

一、XML 可扩展标记语言是什么？是一段有规范的字符串，用在哪？用在任何地方语法：* 结点Node<结点名属性名="属性值"> 结点内容</结点名>* 结点的开始和结尾配对* 结点内可以有子结点* 结点内可以有文本* 结点名和属性名区分大小写* 结点不能交叉* 结点名和属性名随便写术语：结点、属性叶子结点：没有子结点的结点 <a b="c"></a>可以简化<a b="c" />非叶子结点：有子结点的结点对于存储数据...

Mybatis中mybatis-config.xml文件的解析【代码】

Mybatis中mybatis-config.xml文件的解析： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE configuration PUBLIC "-//mybatis.org//DTD Config 3.0//EN" "http://mybatis.org/dtd/mybatis-3-config.dtd"> <configuration><properties resource="database.properties"/><settings><setting name...

iOS中JSON解析和XML解析的区别

iOS中网络传输的格式可粗略的分为XML和JSON两种,具体的传输方式又可分为GET和POST. 其中XML格式是最早出现的,但是由于复杂,并且占用字节数相对较大,故不太适合移动端,后来简化为JSON格式. JSON本身的数据结构只有字典和数组两种,在IOS5以后出现了原生解析,而之前则有SBJson和JsonKit第三方库解析.SBJson和JsonKit的特点:　　1.第三方库解析SBJson是所有解析效率里面最低的,之所以能够广泛普及,是因为其简单,封装的低耦合性,可以快...

JAVA SAX解析XML字符串实例【代码】

Demo代码如下：package com.wenqi.demo;import java.io.IOException; import java.io.StringReader; import java.util.List; import org.jdom.Document; import org.jdom.Element; import org.jdom.JDOMException; import org.jdom.input.SAXBuilder; import org.xml.sax.InputSource;/** * @author cwqi * @createTime 2014-9-1 * @version */ public class XmlStringReader {/** * @param args */public static void main(S...

InputStream流解析 XML文件【代码】

1// 根据InputStream流解析 XML文件 2privatevoid getNewsFromStream(InputStream is){3// 1.创建XML pull 解析器谷歌内置解析器 4 XmlPullParser xp = Xml.newPullParser();5try {6//2.指定解析器要解析的文件和解析文件所用到的编码方式 7 xp.setInput(is,"utf-8");8//3.开始解析文件（在解析之前需要有 JavaBean，先创建JavaBean）910// 获取事件类型，通过事件类型去判断当前解析的是什么节点11int t...

使用java自带的xml解析器解析xml【代码】

使用java自带的xml解析器解析xml,其实我不推荐，可以用Dom解析，或其他的方式，因为Java自带的解析器使用不但麻烦，且还有bug出现。它要求，针对不同的xml(结构不同)，必须写对应的handler处理类，而Dom解析可以写通用的方法（前提是要写出通用逻辑）来处理，开发比较快。下面上代码 1//------------------ main point --------------------- 2javax.xml.parsers.SAXParserFactory3publicstaticvoid main(String[] args)4 ...

XML之SAX解析模型

DOM解析会把整个XML文件全部映射成Document里的树形结构，当遇到比较大的文件时，它的内存占用很大，查找很慢SAX就是针对这种情况出现的解决方案，SAX解析器会从XML文件的起始位置起进行解析，同时根据已经定义好的事件处理器，来决定当前所解析的部分是否有必要进行记录并存储import java.io.File; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory;public class SaxParser{ public static void m...

Dom4j解析xml

1、为什么使用dom4j解析xml　　DOM4J 表现更优秀，具有性能优异、功能强大和极端易用使用2、所需jar包　　dom4j-1.6.1.jar3、使用方法 package com;import java.io.InputStream;import java.util.Iterator;import java.util.List;import org.dom4j.Attribute;import org.dom4j.Document;import org.dom4j.Element;import org.dom4j.io.SAXReader; public class Dom4jParseXML { public static void main(String[] args) throws Exc...

50.使用DOM4J解析XML文件【代码】

需要导入dom4j-1.6.1.jar收藏信息.xml<?xml version="1.0" encoding="GBK"?><PhoneInfo><Brand name="华为"><Type name="U8650"/><Type name="HW123"/><Type name="HW321"/></Brand><Brand name="苹果"><Type name="iPhone4"/></Brand><Brand name="三星"><Type name="Note4"/></Brand></PhoneInfo>新收藏.xml<?xml version="1.0" encoding="GBK"?><PhoneInfo><Brand name="华为"><Type name="U8650"/><Type name="HW123"/><Type n...

XML解析中的namespace初探

原文:XML解析中的namespace初探初学者在解析XML文件的时候最容易遇到的问题恐怕就是XML的namespace了，本文旨在对namespace做一个简要的介绍。namespace的意义无需多说，和C++，C#等高级语言一样，XML同样面临大量文件放在一起的时候变量重名的问题，所以要用namespace把名字相同意义不同的变量隔离开。本文着重讨论namespace的解析方法。以下是一个简单的XML文件:<root> <child id = ‘0’> hello world </child> <c...

XML - 最热教程

基于DOM4j和POI实现的XML文件转换为XLS...php+mysql+xml实现的问卷调查（代码）XMLHttpRequest中responseText如何获取...C# XELEMENT 解析xml文件(字符串)Maven 项目之pom.xml 提示Unknow Error Android中序列化对象到XMl 和 XML反序列...用Java将XML文档保存在数据库中(Hibern...c# – 如何更新XML节点？解决java.lang.ClassNotFoundException...php – 通过SimpleXMLElement循环访问属...

首页 / XML / Python XML 解析

Python XML 解析

内容导读

内容图文

Python XML 解析

什么是 XML？

Python 对 XML 的解析

1.SAX (simple API for XML )

2.DOM(Document Object Model)

3.ElementTree(元素树)

movies.xml

python使用SAX解析xml

ContentHandler类方法介绍

make_parser方法

parser方法

parseString方法

Python 解析XML实例

实例

使用xml.dom解析xml

实例

内容总结

内容备注

内容手机端

【Python XML 解析】教程文章相关的互联网学习教程文章

PYTHON - 相关标签

XML - 相关标签

XML - 最新教程

XML - 最热教程