首页 / XML / python-lxml和in
python-lxml和in
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python-lxml和in,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含774字,纯文字阅读大概需要2分钟。
内容图文
![python-lxml和in](/upload/InfoBanner/zyjiaocheng/663/8eb704da4c2943c7b73f09c1778fafd0.jpg)
我在lxml中遇到了一个奇怪的错误:
>>> s = '<html><head><noscript></noscript><script></script><meta></head></html>'
>>> root = lxml.html.fromstring(s)
>>> root.xpath('/html/head/meta')
>>> root.xpath('/html/body/meta')
[<Element meta at 0x2a92788>]
元标记应位于head元素中,而不是body中.在这种情况下如何获得正确的元素?
解决方法:
让我猜测:您是否正在使用旧版本的Ubuntu(例如12.04)?
实际上,这是lxml软件包使用的预安装libxml2库的旧版本中的错误.在版本2.8.0的release notes中,他们提到了对HTML解析器错误的修复,其中< noscript>在< head>中-所以我猜libxml2> = 2.8.0的版本应该可以工作. Ubuntu 12.04已安装版本2.7.8.
>>> import lxml.etree
>>> lxml.etree.LIBXML_COMPILED_VERSION
(2, 7, 8)
>>> lxml.etree.LIBXML_VERSION
(2, 9, 1)
我认为,如果这些版本中的任何一个> = 2.8.0,则< noscript>
问题应该消失了.
内容总结
以上是互联网集市为您收集整理的python-lxml和in全部内容,希望文章能够帮你解决python-lxml和in所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。