PDF转PNG图片【pdfbox】/**** PDF文件转PNG图片,全部页数* @param PdfFilePath pdf完整路径* @param imgFilePath 图片存放的文件夹* @param dpi dpi越大转换后越清晰,相对转换速度越慢* @return*/public void pdf2Image(String PdfFilePath, String dstImgFolder, int dpi) {File file = new File(PdfFilePath);PDDocument pdDocument;try {String imgPDFPath = file.getParent();int dot = file.getName().lastIndexOf('.');Str...
Digital text with text and background image我正在尝试使用Java中的PDFBox对PDF文件进行数字签名,并在页面上显示可见文本,类似于在Acrobat中手动创建的页面.如图中所示(我只寻找快照,另一个也拥有数字签名的细节),此示例显示了使用图像文件进行签名.怎么做?解决方法:该代码将包含在即将发布的PDFBox 2.0.9版本的样本中.另请参见PDFBOX-3198中的讨论.它更加灵活,可以同时包含文本和图像,或者仅包含两者之一,也可以包含矢量图形,无...
我正在尝试使用PDFBOX创建PDF / A文件,并且文件生成成功完成,但是生成的文件很大…有时500 MB甚至更多.有什么方法可以减少生成时的文件大小吗?解决方法:如评论中所讨论:特定字体的PDFont对象仅应构造一次,并且可以在一个PDF的不同页面中重复使用.
对于使用PDType0Font.load()的字体,应将其子集化(即,仅嵌入使用过的字形).
这同样适用于PDXObjectImage对象,例如用于公司徽标:PDXObjectImage应该创建一次,并在一个PDF的不同页面中...
这是我目前面临的挑战.我有很多PDF,必须删除其中的空白页面,而仅显示包含内容(文本或图像)的页面.问题是这些pdf是扫描的文档.因此,空白页的扫描仪会留下一些脏污.解决方法:我进行了一些研究,最终得到了这段代码,该代码检查了白色或浅灰色页面的99%.我需要灰度系数,因为扫描的文档有时不是纯白色的.private static Boolean isBlank(PDPage pdfPage) throws IOException {BufferedImage bufferedImage = pdfPage.convertToImage();l...
我正在尝试使用pdfbox打印现有的pdf文件.目前,我正在通过Maven使用pdfbox 2.0.0 RC3.
这是我当前的代码:PDDocument document = PDDocument.load(new File(myPdfFile));
PrinterJob job = PrinterJob.getPrinterJob();if (job.printDialog()) {job.setPageable(new PDFPageable(document));job.print();
}document.close();为了进行测试,我使用Adobe Acrobat打印了一个测试pdf,并用几行代码打印了相同的pdf.除边界外,其他一切正常....
第一次海报,和我一起…
我有两个问题.首先,我想知道如何使用BufferedImage将图像添加到PDFBox 2.0文档.在这里提出的问题:Add BufferedImage to PDFBox document
此后,PDFBox整体排除了PDJpeg类和xobject部分.
其次,如果有人已经问过这个问题并且已经回答了,但是答案已过时;更新/联系这两个问题的最佳方法是什么? (我没有任何要点,所以我无法发表评论).解决方法:PDFBox has since excluded the PDJpeg class and the xobject sec...
各位程序员,您好!
我可以正确提取pdf文本坐标及其格式.但是我不能用图像做到这一点.
我可以得到适当的宽度和高度,但是它给了我错误的x和y.
我正在使用photoshop检查即时消息是否获得正确的x,y,宽度,高度坐标但只有宽度和高度正确
这是我的代码@Overridepublic void processOperator(Operator operator, List<COSBase> arguments) throws IOException {if ("cm".equals(operator.getName())) {float width = ((COSNumber)arguments...
我想使用PDFBox API将文本添加到PDF,并将其旋转45度,然后将其放置在页面的中心,文本是动态的,应始终放置在中心,除居中部分外,其他所有工作,我们将不胜感激.我有以下代码:Point2D.Float pageCenter = getCenter(page);float stringWidth = getStringWidth(watermarkText, font, fontSize);
float textX = pageCenter.x - stringWidth / 2F + center.x;
System.out.println(textX);
float textY = pageCenter.y + center.y;
//Syste...
尝试将阿拉伯语单词保存在可编辑的PDF中.它对英语语言来说都可以正常工作,但是当我使用阿拉伯语单词时,出现了这个异常:java.lang.IllegalArgumentException:U+0627 is not available in this font Helvetica encoding: WinAnsiEncoding这是我生成PDF的方式:public static void main(String[] args) throws IOException
{String formTemplate = "myFormPdf.pdf";try (PDDocument pdfDocument = PDDocument.load(new File(formTemp...
我有一个pdf坐标(x,y)作为输入.我需要在给定的输入坐标处绘制字符串[Eg:-(x,y)=(200,250)].我正在使用pdfbox,当我使用以下方法moveTextPositionByAmount时,我没有得到确切的位置.即使我已经尝试过moveTo().请帮助我如何在精确的位置画线?PDPageContentStream contentStream = new PDPageContentStream(document, page,true,true);
contentStream.beginText();
contentStream.setFont(PDType1Font.HELVETICA_BOLD, 12);
contentSt...
我正在阅读PDF并输出其中包含原始PDF的多个副本的PDF.我对PDFBox和iText做同样的事情进行测试.如果我分别复制每个页面,iText会创建一个更小的输出.
问题:在PDFBox中还有另一种方法可以实现较小的输出PDF.
对于一个示例输入文件,使用两个工具生成两个副本到输出:
>原始PDF大小:30K> PDFBox(v 1.7.1)生成的PDF:84K> iText(v 5.3.4)生成的PDF:35K
PDFBox的Java代码(很抱歉给您造成错误处理).请注意,它是如何反复读取输入并将其整...
使用qpdf,您可以简单地从pdf中删除限制/加密,如下所示:qpdf --decrypt infile outfile我想用Java中的PDFBox做同样的事情:PDDocument doc = PDDocument.load(inputFilename);
if( doc.isEncrypted() )
{//remove the encryption to alter the document
}我已经尝试使用StandardDecryptionMaterial,但我不知道所有者密码是什么. qpdf如何做到这一点?
样本文件:https://issues.apache.org/jira/secure/attachment/12514714/in.pdf...
输入:包含嵌入字体的(例如14个)PDF / A-1b文件列表.处理:与Apache PDFBOX进行简单合并.结果:1个文件大小(太大)的PDF / A-1b文件. (它几乎是所有源文件大小的总和).
问题:有没有办法减少生成的PDF的文件大小?想法:删除冗余的嵌入字体.但是怎么样?这是正确的方法吗?
不幸的是,以下代码没有完成这项工作,但突出了明显的问题.try (PDDocument document = PDDocument.load(new File("E:/tmp/16189_ZU_20181121195111_5544_2008-...
我正在使用java pdfBox库来验证带有嵌入式图像的单页pdf文件.
我知道pdf文件本身不包含DPI信息.
然而,文档中具有相同尺寸的图像在提取后具有不同的像素大小并且没有dpi元信息.
那么有可能以某种方式计算相对于pdf页面的图像大小或使用pdfBox提取其dpi信息(对于png或jpeg图像文件)的图像?
谢谢!解决方法:从PDFBOX src下载获取PrintImageLocations.java文件.这是一个除了源,只有最后一行是由我,它将输出dpi:float imageXScale = c...
我刚开始使用PDFBox,提取文本等等.我感兴趣的一件事是我正在提取的文本本身的颜色.但是我似乎找不到任何获取这些信息的方法.
是否有可能使用PDFBox来获取文档的颜色信息,如果是这样,我将如何去做?
非常感谢.解决方法:所有颜色信息都应存储在PDGraphicsState类中,使用的颜色(描边/非描边等)取决于使用的文本呈现模式(通过pdfbox邮件列表).
这是我尝试的一个小样本:
在创建仅包含一行的pdf(“Sample”以RGB = [146,208,80]编写)后,...