如何解析包含javascript代码的html
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了如何解析包含javascript代码的html,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1577字,纯文字阅读大概需要3分钟。
内容图文
如何解析大量使用javascript的html文档?我知道python中有一些库可以解析静态的xml / html文件而且我基本上都在寻找一个程序或库(甚至是firefox插件),它可以读取html javascript,执行javascript位并输出html代码而不需要javascript所以如果在浏览器中显示,它看起来会相同.
举个简单的例子
<a href="javascript:web_link(34, true);">link</a>
应该用javascript函数返回的适当值替换,例如
<a href="http://www.example.com">link</a>
一个更复杂的例子是一个保存的facebook html页面,里面堆满了大量的javascript代码.
可能与…有关
How to “execute” HTML+Javascript page with Node.js
但我真的需要Node.js和JSDOM吗?也略有关系
Python library for rendering HTML and javascript
但我对渲染纯html输出不感兴趣.
解决方法:
您可以将Selenium与python一起使用,详见here
例:
import xmlrpclib
# Make an object to represent the XML-RPC server.
server_url = "http://localhost:8080/selenium-driver/RPC2"
app = xmlrpclib.ServerProxy(server_url)
# Bump timeout a little higher than the default 5 seconds
app.setTimeout(15)
import os
os.system('start run_firefox.bat')
print app.open('http://localhost:8080/AUT/000000A/http/www.amazon.com/')
print app.verifyTitle('Amazon.com: Welcome')
print app.verifySelected('url', 'All Products')
print app.select('url', 'Books')
print app.verifySelected('url', 'Books')
print app.verifyValue('field-keywords', '')
print app.type('field-keywords', 'Python Cookbook')
print app.clickAndWait('Go')
print app.verifyTitle('Amazon.com: Books Search Results: Python Cookbook')
print app.verifyTextPresent('Python Cookbook', '')
print app.verifyTextPresent('Alex Martellibot, David Ascher', '')
print app.testComplete()
内容总结
以上是互联网集市为您收集整理的如何解析包含javascript代码的html全部内容,希望文章能够帮你解决如何解析包含javascript代码的html所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。