首页 / HTML / Python中的HTML页面为PDF？

Python中的HTML页面为PDF？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python中的HTML页面为PDF？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含461字，纯文字阅读大概需要1分钟。

内容图文

是否有可用于将HTML页面(文本,图像,布局元素等)转换为PDF文件的库.

我有一个HTML页面,上面有数字,文字和数字等表格,我希望我的客户能够以PDF格式下载.我如何用Python做到这一点？

解决方法:

不太熟悉python,如果你愿意把现金掏空,王子会很好.这个http://github.com/antialize/wkhtmltopdf使用webkit.它是一个简单的命令行实用程序,您可以调用它,它将尊重html css.据我所知,它是唯一能做得很好的免费工具.它有一个ruby的宝石http://github.com/jdpace/PDFKit,不是它可以帮助你,但可能会给你一些想法.

内容总结

以上是互联网集市为您收集整理的Python中的HTML页面为PDF？全部内容，希望文章能够帮你解决Python中的HTML页面为PDF？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/789590.html

来源：【匿名】

【上一篇】使用Python进行复杂的HTML解析【下一篇】PHP 和 HTML

更多 ►

【Python中的HTML页面为PDF？】教程文章相关的互联网学习教程文章

相当于wxPython中的HTML多重SELECT框

我想在wxPython中创建一个ListBox,其语义与HTML中的多选框相同.具体来说,我想要以下语义 >当用户单击列表中的条目时,所有其他条目都将被取消选择,并且所单击的条目将被选择.如果该条目已被选中,则它将保持选中状态. >当用户在单击某个条目时按住Ctrl键时,所有其他条目保持不变,但是会切换是否选择了单击的条目. >当用户按住shift键并单击一个条目时,该条目以及该条目与最后单击的条目之间的每个条目都会被选中. 在Java中,我可以...

如何使用Python中的XSL样式表将XML转换为HTML？

我有一个XSL样式表模板,可以将我的XML文件转换为HTML.如何使用Python执行此类处理？ …and here’s the link to really simple solution:)解决方法:使用lxml,其中supports XSLT 1.0.

正则表达式,用于从Python中的字符串中删除html标签【代码】

我正在使用以下代码从RSS提要中获取我的结果：try:desc = item.xpath('description')[0].textif date is not None:desc =date +"\n"+"\n"+desc except:desc = None但有时,说明中包含RSS提要中的html标签,如下所示：This is samle text < img src=”http://imageURL” alt=”” />在显示内容时,我不想在页面上显示任何HTML标记.是否有任何正则表达式删除HTML标签.解决方法:尝试：pattern = re.compile(u'<\/?\w+\s*[^>]*?\/?>', re...

使用Python中的regex匹配两个字符串中的HTML标签【代码】

我想验证源字符串中存在的HTML标签也存在于目标字符串中. 例如：>> source = 'Hello<label>What's your name</label>' >> verify_target(’Hi<label>My name is Jim</label>') True >> verify_target('<label>My name is Jim</label>Hi') True >> verify_target('Hi<label>My name is Jim</label>') False解决方法:我会放弃正则表达式,然后查看Beautiful Soup.findAll(True)列出在源中找到的所...

需要帮助来解析python3中的html,格式不适合xml.etree.ElementTree

我到处都有不匹配的标记错误.我不确定为什么会这样,这对craigslist主页上的文字对我来说看起来不错,但是我还没有对它进行足够的略读.也许我可以使用一些更宽容的方法,或者这是与标准库进行html解析的最佳选择？解决方法:标签不匹配的错误很可能是由标签不匹配引起的.浏览器以接受草率的html而闻名,它使网页编码人员可以轻松地编写格式错误的html,因此其中有很多.没有理由认为,creagslist应该不受不良网页设计师的影响. 您需要使用允...

Python中的HTML解析器【代码】

使用Python文档我找到了HTML parser,但我不知道要导入哪个库来使用它,我如何找到它(请记住它没有在页面上说明).解决方法:尝试：import HTMLParser在Python 3.0中,HTMLParser模块已重命名为html.parser你可以检查一下这个here Python 3.0import html.parserPython 2.2及以上版本import HTMLParser

删除python中的所有html？【代码】

有没有办法使用lxml.html删除/转义html标签而不是有一些xss问题的beautifulsoup？我尝试使用清洁,但我想删除所有的HTML.解决方法:尝试使用元素上的.text_content()方法,最好在使用lxml.html.clean删除不需要的内容(脚本标记等等)之后.例如：from lxml import html from lxml.html.clean import clean_htmltree = html.parse('http://www.example.com') tree = clean_html(tree)text = tree.getroot().text_content()

使用styles和css更改pandas dataframe html表python中的文本颜色【代码】

我有一个pandas数据帧：arrays = [['Midland', 'Midland', 'Hereford', 'Hereford', 'Hobbs','Hobbs', 'Childress','Childress', 'Reese', 'Reese', 'San Angelo', 'San Angelo'],['WRF','MOS','WRF','MOS','WRF','MOS','WRF','MOS','WRF','MOS','WRF','MOS']] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples) df = pd.DataFrame(np.random.randn(12, 4), index=arrays,columns=['00 UTC', '06 UTC', '12 ...

使用Python中的BeautifulSoup解析html【代码】

我写了一些代码来解析html,但结果不是我想要的：import urllib2 html = urllib2.urlopen('http://dummy').read() from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(html) for definition in soup.findAll('span', {"class":'d'}): definition = definition.renderContents() print "<meaning>", definition for exampleofuse in soup.find('span',{"class":'x'}):print "<exampleofuse>", exampleofuse, "<exampleof...

解析HTML：Python中的lxml错误【代码】

我正在编写一个简单的脚本来从here获取大灰色表. 我的代码如下：import urllib2 from lxml import etreehtml = urllib2.urlopen("http://www.afi.com/100years/movies10.aspx").read()root = etree.XML(html)但是我在最后一个声明中收到错误.Traceback (most recent call last):File "D:\Workspace\afi100\afi100.py", line 13, in <module>root = etree.XML(html)File "lxml.etree.pyx", line 2720, in lxml.etree.XML (src/lxml/...

如何在python中的html中获取文本【代码】

我想用python捕获html中的一些文本.例..#!/usr/bin/python import urllibopen = urllib.urlopen('http://localhost/main.php') read = open.read() print read以及目标网址的源代码<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset...

如何使用Python中的Mechanize获取嵌套标签中的HTML属性？【代码】

所有.我在使用Python中的Mechanize获取嵌套HTML中的链接时遇到了麻烦.这是我当前的代码(我已经尝试了一切;这只是最新的副本,它无法正常工作)(并原谅我的变量名称(东西,东西))：soup = BeautifulSoup(resultsPage)if not soup.find(attrs={'class' : 'paging'}):print "Only one producted listed!" else: stuff = soup.find('div', attrs={'class' : 'paging'}).ul.lifor thing in stuff:print thing这是我正在看的HTML：<div cl...

使用Python中的漂亮汤在html页面上调用“on click event”的问题【代码】

我试图抓取网页上所有项目的名称,但默认情况下,页面上只显示18个项目.我的代码只抓取那些.您可以通过单击“全部显示”按钮查看所有项目,但该按钮是Javascript. 经过一番研究,我发现PyQt模块可以用来解决这个涉及javascript按钮的问题.我用它但我仍然无法调用“on click”事件.以下是推荐代码：import csv import urllib2 import sys import time from bs4 import BeautifulSoup from PyQt4.QtGui import * from PyQt4.QtCore imp...

模仿通过Python中的Selenium使用的PhantomJS上的HTML5视频支持【代码】

我正在尝试提取视频标记中的HTML5视频的源链接.使用Firefox webdrive,我能够获得所需的结果,即 – [<video class="video-stream html5-main-video" src='myvideoURL..'</video>]但如果我使用PhantomJS – <video class="video-stream html5-main-video" style="width: 854px; height: 480px; left: 0px; top: 0px; -webkit-transform: none;" tabindex="-1"></video>我怀疑这是因为PhantomJS缺乏HTML5视频支持.反正我是否可以欺骗...