首页 / XML / 使用lxml.etree解析python alexa结果

使用lxml.etree解析python alexa结果

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用lxml.etree解析python alexa结果，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3115字，纯文字阅读大概需要5分钟。

内容图文

我正在使用来自AWS的Alexa api,但发现解析结果以获得我想要的东西很困难

alexa api返回对象树< type'lxml.etree._ElementTree'>

我使用此代码来打印树

from lxml import etree
root = tree.getroot()
print etree.tostring(root)

我在下面得到xml

<aws:UrlInfoResponse xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/"><aws:Response xmlns:aws="http://awis.amazonaws.com/doc/2005-07-11"><aws:OperationRequest><aws:RequestId>ccf3f263-ab76-ab63-db99-244666044e85</aws:RequestId></aws:OperationRequest><aws:UrlInfoResult><aws:Alexa>

  <aws:ContentData>
    <aws:DataUrl type="canonical">google.com/</aws:DataUrl>
    <aws:SiteData>
      <aws:Title>Google</aws:Title>
      <aws:Description>Enables users to search the world's information, including webpages, images, and videos. Offers unique features and search technology.</aws:Description>
      <aws:OnlineSince>15-Sep-1997</aws:OnlineSince>
    </aws:SiteData>
    <aws:LinksInCount>3453627</aws:LinksInCount>
  </aws:ContentData>
  <aws:TrafficData>
    <aws:DataUrl type="canonical">google.com/</aws:DataUrl>
    <aws:Rank>1</aws:Rank>
  </aws:TrafficData>
</aws:Alexa></aws:UrlInfoResult><aws:ResponseStatus xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/"><aws:StatusCode>Success</aws:StatusCode></aws:ResponseStatus></aws:Response></aws:UrlInfoResponse>

我使用root.find(‘LinksInCount’).text获取element的值,但是它不起作用.

我想知道如何获取aws：LinksInCount的文本3453627

解决方法:

您遇到两个挑战：

>使用名称空间的XML
>两个共享相同名称空间前缀的名称空间

具有两个不同名称空间重用前缀的XML文档

您会看到“ aws：”前缀,但是它用于两个不同的名称空间：

xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/"
xmlns:aws="http://awis.amazonaws.com/doc/2005-07-11"

在XML中使用相同的名称空间前缀是完全合法的.规则是,后一个有效.

xmlstr = """
<?xml version="1.0"?>
<aws:UrlInfoResponse xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/">
  <aws:Response xmlns:aws="http://awis.amazonaws.com/doc/2005-07-11">
    <aws:OperationRequest>
      <aws:RequestId>ccf3f263-ab76-ab63-db99-244666044e85</aws:RequestId>
    </aws:OperationRequest>
    <aws:UrlInfoResult>
      <aws:Alexa>
        <aws:ContentData>
          <aws:DataUrl type="canonical">google.com/</aws:DataUrl>
          <aws:SiteData>
            <aws:Title>Google</aws:Title>
            <aws:Description>Enables users to search the world's information, including webpages, images, and videos. Offers unique features and search technology.</aws:Description>
            <aws:OnlineSince>15-Sep-1997</aws:OnlineSince>
          </aws:SiteData>
          <aws:LinksInCount>3453627</aws:LinksInCount>
        </aws:ContentData>
        <aws:TrafficData>
          <aws:DataUrl type="canonical">google.com/</aws:DataUrl>
          <aws:Rank>1</aws:Rank>
        </aws:TrafficData>
      </aws:Alexa>
    </aws:UrlInfoResult>
    <aws:ResponseStatus xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/">
      <aws:StatusCode>Success</aws:StatusCode>
    </aws:ResponseStatus>
  </aws:Response>
</aws:UrlInfoResponse>
"""

下一个挑战是如何搜索命名空间元素.

我更喜欢使用xpath,为此,您可以在xpath表达式中使用所需的任何名称空间,但是您必须告诉xpath调用这些前缀的含义.这是通过命名空间字典完成的：

from lxml import etree
doc = etree.fromstring(xmlstr.strip())

namespaces = {"aws": "http://awis.amazonaws.com/doc/2005-07-11"}
texts = doc.xpath("//aws:LinksInCount/text()", namespaces=namespaces)
print texts[0]

内容总结

以上是互联网集市为您收集整理的使用lxml.etree解析python alexa结果全部内容，希望文章能够帮你解决使用lxml.etree解析python alexa结果所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/689673.html

来源：【匿名】

【上一篇】java-如何使用xpath编辑特定的xml 【下一篇】PHP和JAVA的XML-RPC中文问题解决办法

更多 ►

【使用lxml.etree解析python alexa结果】教程文章相关的互联网学习教程文章

XML、JSON数据结构解析

一、XML的解析XML的解析分为SAX解析和DOM解析，DOM解析又分为根节点解析和叶子节点解析。1.SAX解析步骤a.获取XML数据存储的文件路径(假如XML文件为Students.xml) NSString *filePath = [[NSBundle mainBundle]pathForResource:@"Students" ofType:@"xml"]; b.创建解析对象 //创建二进制数据对象 NSData *data = [NSData dataWithContentsOfFile:filePath]; NSXMLParser *parser = [[NSXMLParser alloc]initWithData:da...

springMVC初探视图解析器——XmlViewResolver【图】

XmlViewResolver解析器XmlViewResolver基于XML文件中的视图bean来解析“逻辑视图”。XmlViewResolver默认会从/WEB-INF/views.xml中加载视图bean，当然你也可以自己设置该xml文件的位置，该解析器有个属性“location”可设置xml位置当处理器返回“逻辑视图”(假设返回”jsonview“)时，解析器XmlViewResolver会在对应的views.xml文件中寻找Id为jsonview的Bean，如果找到就处理。views.xml中的配置如图：处理类：前台页面显示：注意...

Delphi之通过代码示例学习XML解析【代码】【图】

这个程序可以用于解析任何合法的XML字符串。首先是看一下程序的运行效果：　　　　　　　　　　　　　　以解析这样一个XML的字符串为例：<?xml version="1.0" encoding="UTF-8"?><BookInfo><Owner><OwnerName>张三</OwnerName><OwnerAge>1234</OwnerAge></Owner><BookMes><BookName>时间简史</BookName><ISDN>234343453534</ISDN><Writer>霍金</Writer></BookMes></BookInfo>　　首先是打开应用程序　　然后将上面所示的字符串复制...

iOS 网络数据之XML解析【代码】

<pre name="code" class="objc"><address> </address>向服务器请求数据，那么数据必须以某个特定的格式存放，然后一方把数据按这种格式组织起来，另一方按相同的方式把数据解析数来，就像是我们人之间讲话交流，我们的话...

[Python]HTML/XML解析器Beautiful Soup

【简介】Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。即HTML/XMLX的解析器。它可以很好的处理不规范标记并生成剖析树(parse tree)。它提供简单又常用的导航（navigating），搜索以及修改剖析树的操作。它可以大大节省你的编程时间。【安装】下载地址：点击打开链接Linux平台安装：如果你用的是新版的Debain或ubuntu,那么可以通过系统的软件包管理来安装:$ apt-get install Python-bs4Beautiful Soup 4 通过P...

03-IOSCore - XML及解析、Plist【代码】【图】

一、XML 可扩展标记语言是什么？是一段有规范的字符串，用在哪？用在任何地方语法：* 结点Node<结点名属性名="属性值"> 结点内容</结点名>* 结点的开始和结尾配对* 结点内可以有子结点* 结点内可以有文本* 结点名和属性名区分大小写* 结点不能交叉* 结点名和属性名随便写术语：结点、属性叶子结点：没有子结点的结点 <a b="c"></a>可以简化<a b="c" />非叶子结点：有子结点的结点对于存储数据...

Mybatis中mybatis-config.xml文件的解析【代码】

Mybatis中mybatis-config.xml文件的解析： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE configuration PUBLIC "-//mybatis.org//DTD Config 3.0//EN" "http://mybatis.org/dtd/mybatis-3-config.dtd"> <configuration><properties resource="database.properties"/><settings><setting name...

iOS中JSON解析和XML解析的区别

iOS中网络传输的格式可粗略的分为XML和JSON两种,具体的传输方式又可分为GET和POST. 其中XML格式是最早出现的,但是由于复杂,并且占用字节数相对较大,故不太适合移动端,后来简化为JSON格式. JSON本身的数据结构只有字典和数组两种,在IOS5以后出现了原生解析,而之前则有SBJson和JsonKit第三方库解析.SBJson和JsonKit的特点:　　1.第三方库解析SBJson是所有解析效率里面最低的,之所以能够广泛普及,是因为其简单,封装的低耦合性,可以快...

JAVA SAX解析XML字符串实例【代码】

Demo代码如下：package com.wenqi.demo;import java.io.IOException; import java.io.StringReader; import java.util.List; import org.jdom.Document; import org.jdom.Element; import org.jdom.JDOMException; import org.jdom.input.SAXBuilder; import org.xml.sax.InputSource;/** * @author cwqi * @createTime 2014-9-1 * @version */ public class XmlStringReader {/** * @param args */public static void main(S...

InputStream流解析 XML文件【代码】

1// 根据InputStream流解析 XML文件 2privatevoid getNewsFromStream(InputStream is){3// 1.创建XML pull 解析器谷歌内置解析器 4 XmlPullParser xp = Xml.newPullParser();5try {6//2.指定解析器要解析的文件和解析文件所用到的编码方式 7 xp.setInput(is,"utf-8");8//3.开始解析文件（在解析之前需要有 JavaBean，先创建JavaBean）910// 获取事件类型，通过事件类型去判断当前解析的是什么节点11int t...

使用java自带的xml解析器解析xml【代码】

使用java自带的xml解析器解析xml,其实我不推荐，可以用Dom解析，或其他的方式，因为Java自带的解析器使用不但麻烦，且还有bug出现。它要求，针对不同的xml(结构不同)，必须写对应的handler处理类，而Dom解析可以写通用的方法（前提是要写出通用逻辑）来处理，开发比较快。下面上代码 1//------------------ main point --------------------- 2javax.xml.parsers.SAXParserFactory3publicstaticvoid main(String[] args)4 ...

XML之SAX解析模型

DOM解析会把整个XML文件全部映射成Document里的树形结构，当遇到比较大的文件时，它的内存占用很大，查找很慢SAX就是针对这种情况出现的解决方案，SAX解析器会从XML文件的起始位置起进行解析，同时根据已经定义好的事件处理器，来决定当前所解析的部分是否有必要进行记录并存储import java.io.File; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory;public class SaxParser{ public static void m...

Dom4j解析xml

1、为什么使用dom4j解析xml　　DOM4J 表现更优秀，具有性能优异、功能强大和极端易用使用2、所需jar包　　dom4j-1.6.1.jar3、使用方法 package com;import java.io.InputStream;import java.util.Iterator;import java.util.List;import org.dom4j.Attribute;import org.dom4j.Document;import org.dom4j.Element;import org.dom4j.io.SAXReader; public class Dom4jParseXML { public static void main(String[] args) throws Exc...

50.使用DOM4J解析XML文件【代码】

需要导入dom4j-1.6.1.jar收藏信息.xml<?xml version="1.0" encoding="GBK"?><PhoneInfo><Brand name="华为"><Type name="U8650"/><Type name="HW123"/><Type name="HW321"/></Brand><Brand name="苹果"><Type name="iPhone4"/></Brand><Brand name="三星"><Type name="Note4"/></Brand></PhoneInfo>新收藏.xml<?xml version="1.0" encoding="GBK"?><PhoneInfo><Brand name="华为"><Type name="U8650"/><Type name="HW123"/><Type n...

XML解析中的namespace初探

原文:XML解析中的namespace初探初学者在解析XML文件的时候最容易遇到的问题恐怕就是XML的namespace了，本文旨在对namespace做一个简要的介绍。namespace的意义无需多说，和C++，C#等高级语言一样，XML同样面临大量文件放在一起的时候变量重名的问题，所以要用namespace把名字相同意义不同的变量隔离开。本文着重讨论namespace的解析方法。以下是一个简单的XML文件:<root> <child id = ‘0’> hello world </child> <c...

XML - 最热教程

基于DOM4j和POI实现的XML文件转换为XLS...php+mysql+xml实现的问卷调查（代码）XMLHttpRequest中responseText如何获取...C# XELEMENT 解析xml文件(字符串)Maven 项目之pom.xml 提示Unknow Error Android中序列化对象到XMl 和 XML反序列...用Java将XML文档保存在数据库中(Hibern...c# – 如何更新XML节点？解决java.lang.ClassNotFoundException...php – 通过SimpleXMLElement循环访问属...

首页 / XML / 使用lxml.etree解析python alexa结果

使用lxml.etree解析python alexa结果

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用lxml.etree解析python alexa结果】教程文章相关的互联网学习教程文章

XML、JSON数据结构解析

springMVC初探视图解析器——XmlViewResolver【图】

Delphi之通过代码示例学习XML解析【代码】【图】

iOS 网络数据之XML解析【代码】

[Python]HTML/XML解析器Beautiful Soup

03-IOSCore - XML及解析、Plist【代码】【图】

Mybatis中mybatis-config.xml文件的解析【代码】

iOS中JSON解析和XML解析的区别

JAVA SAX解析XML字符串实例【代码】

InputStream流解析 XML文件【代码】

使用java自带的xml解析器解析xml【代码】

XML之SAX解析模型

Dom4j解析xml

50.使用DOM4J解析XML文件【代码】

XML解析中的namespace初探

PYTHON - 相关标签

TREE - 相关标签

XML - 相关标签

XML - 最新教程

XML - 最热教程