【如何在python中使用find_element_by_id()】教程文章相关的互联网学习教程文章

python-lxml element.clear()和访问子元素【代码】

我正在使用lxml.iterparse来解析一个相当大的xml文件.在某个时刻会引发内存不足异常.我知道类似的问题,并且有一棵树,当您不再使用它时,通常应使用element.clear()清除它. 我的代码如下所示(缩短):for event,element in context :if element.tag == xmlns + 'initialized': attributes = element.findall(xmlns+'attribute') heapsize = filter(lambda x:x.attrib['name']=='maxHeapSize', attributes)[0].attrib[...

python-使用ElementTree和多个元素进行XML解析【代码】

我需要解析一个看起来像这样的XML:<tag>text1 text2 text3<some-tag/>More text<some-tag/>Some more text<some-tag/>Even more text </tag>使用ElementTree的head和tail方法,可以获得“ text1 text2 text3”和“ Even more text”. 但是,我无法提出一种到达中间文本的方法(“更多文本”和“更多文本”). 由于生成XML的软件的特殊性,我无法确定杂散标签,因此无法使用命令find(‘some-tag’). 有什么方法可以使用python解析此XML?...

python-从lxml.objectify.IntElement获取str或int【代码】

嗨,我在objectify-element中有一个不同类型值的字典,我想从这些值中获取python类型. 例如print type(deal['id'])将打印出来<type 'lxml.objectify.IntElement'>但我想要这样的价值<type 'int'>非常感谢您的帮助!解决方法:实际上,只需处理deal [‘id’].pytype. 由于我没有使用objectify的解析器,而是使用了标准的XMLParser,因此花了点时间使所有这些正确排序. 经过数小时的反复阅读相同的文本,我发现Objectify Help Docs提供了所有...

python-使用lxml处理请求中的html. TypeError:无法腌制_ElementUnicodeResult对象【代码】

我正在尝试在页面上的特定xpath上找到数据.我可以通过请求到达页面.通过使用r.text将源代码打印到屏幕上,并将显示的文本与我要查找的文本进行比较,我已经验证我处于正确的页面. r.text返回的字符串很难提取我想要的信息.我被告知lxml是通过xpath搜索信息的一种方式.不幸的是,我收到类型错误.from lxml import html import requestspayload = {'login_pass': 'password', 'login_user': 'username','submit':'go'} r = requests.get...

python-dir(element)返回不存在的元素.尝试使用getattr(element,…)失败【代码】

基本上我要做的是:attrs = dir(oe) for attr in attrs:attr_obj = getattr(oe, attr).... more code ...但是getattr调用失败并显示:AttributeError:无此类子项:comment oe是lxml.objectify库的ObjectifiedElement. 当我使用PyCharm调查oe时,它显示了comment属性,但也无法解决它. 这里发生了什么?如果该属性不存在,如何通过dir显示它?解决方法:我不是专家,但lxml可能会重新定义__getattr__.从他们的源代码:def __getattr__(s...

python-使用硒找不到元素find_element_by_partial_link_text【代码】

我试图单击以下页面上的“查看更多结果”按钮:http://www.chadbourne.com/search/people?az[b]=b 我的代码简单明了,我尝试了许多迭代.driver = driver.Firefox() driver.get("http://www.chadbourne.com/search/people?az[b]=b") element = driver.find_element_by_partial_link_text("View more results")要么element = driver.find_element_by_partial_link_text("view")要么element = driver.find_element_by_partial_link_tex...

使用Python的ElementTree查找顶级xml注释【代码】

我正在使用Python的ElementTree解析xml文件,如下所示:et = ElementTree(file=file("test.xml"))test.xml以几行xml注释开头. 有没有办法从et得到这些评论?解决方法:对于ElementTree 1.2.X,有一篇关于Reading processing instructions and comments with ElementTree(http://effbot.org/zone/element-pi.htm)的文章. 编辑: 另一种选择是使用实现ElementTree API的lxml.etree.引用ElementTree compatibility of lxml.etree:Elemen...

python-lxml.etree和xml.etree.ElementTree添加不带前缀的名称空间(ns0,ns1等)【代码】

有没有解决方案可以添加不带前缀的命名空间(我的意思是这些ns0,ns1),它们可以在所有etree实现上使用,或者每个解决方案都可以使用? 目前,我有以下解决方案: > lxml-元素的nsmap参数>(c)ElementTree(python 2.6)-使用空字符串作为前缀注册名称空间方法 问题是(c)python 2.5中的ElementTree,我知道有_namespace_map属性,但是将其设置为空字符串会创建无效的XML,将其设置为None会添加默认的ns0等名称空间,是否有任何可行的解决方案?...

python-用前缀的标记解析.xml? xml.etree.ElementTree【代码】

我可以读取标签,除非有前缀.我没有运气寻找上一个问题. 我需要阅读media:content.我尝试了image = node.find(“ media:content”).Rss输入:<channel><title>Popular Photography in the last 1 week</title><item><title>foo</title><media:category label="Miscellaneous">photography/misc</media:category><media:content url="http://foo.com/1.jpg" height="375" width="500" medium="image"/></item><item> ... </item> ...

如何使用jython / python ElementTree在Google Refine中解析xml【代码】

我试图使用Jython和ElementTree解析Google Refine中的一些xml,但是我一直在努力寻找任何文档来帮助我完成此工作(可能不是Python编码员也无济于事) 这是我要解析的XML的一部分.我正在尝试返回所有dc:indentifier的连接字符串:<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="ht...

用Python的elementtree替换作为数字字符引用一部分的与号【代码】

我正在使用Python的elementtree模块来编写一些XML(我正在使用Python 2.7和3.2).我的某些元素的文本字段包含数字字符引用. 但是,一旦我使用elementtree的字符串将字符引用中的所有“&”号替换为& amp; amp;.显然,elementtree或基础分析器无法识别此处的&符号是数字字符引用的一部分. 经过一番搜索,我发现:elementtree and entities 但是,我也不热衷于此,因为在我当前的代码中,我预见这可能最终会导致自身的问题.除此之外,我对此几乎...

Python / ElementTree:解析内联元素并尊重周围的文字吗?【代码】

我需要解析一些包含内联元素的XML.例如,XML外观如下所示: < section>富巴,我是如此富巴,富巴甚至更多< fref bar =“ baz”> fubare< / fref>.还有更多fubar.< / section> 如果我现在用list(parent)中的elem遍历此结构,则… …我只能访问fref.如果我现在处理fref,则周围的文本当然会丢失,因为文本不是真正的元素. 有人知道正确解决此问题的方法吗?解决方法:下面显示了如何使用lxml实现此目的.>>> from lxml.etree import fromstri...

python-ElementTree iterparse应该花多长时间?【代码】

在回答另一个问题时,有人向我展示了以下教程,作者声称其中使用了iterparse在3秒内解析了约100 MB的XML文件: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python-with-elementtree/ 我正在尝试解析约90 MB的XML文件,并且我有以下代码:from xml.etree.cElementTree import * count = 0for event, elem in iterparse('foo.xml'): if elem.tag == 'identifier' and elem.text == 'bar':count += 1elem.clear(...

如何使用python中的elementtree处理xml文件中格式不正确的字符【代码】

我正在使用ElementTree.parse函数解析用utf-16编码的xml文件.当文件包含一些格式不正确的字符(例如♀,♂等)时,程序将崩溃.并且发生错误“ xml.parsers.expat.ExpatError:格式不正确(无效的令牌)”.如何避免此错误并解决此问题?我怎么能忽略这些格式不正确的字符?谢谢!下面是我的代码:tree = ElementTree() root = tree.parse(xml_file)xml_file是以UTF-16格式编码的文件.该错误将指出格式不正确的字符的行和列号.解决方法:由于...

python-如何解决xml.etree.ElementTree.iterparse()中的Unicode错误?【代码】

我正在使用Python的xml.etree.ElementTree模块的iterparse()方法读取一个巨大的(千兆字节)XML文件.问题是某些XML文件的文本中偶尔会出现Unicode错误(或者至少是Python 3认为是Unicode错误).我的循环是这样设置的:import xml.etree.ElementTree as etreedef foo():# ...f = open(filename, encoding='utf-8')xmlit = iter(etree.iterparse(f, events=('start', 'end')))(event, root) = next(xmlit)for (event, elem) in xmlit: # ...