首页 / PYTHON / python使用PyPDF2库进行PDF基本操作

python使用PyPDF2库进行PDF基本操作

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python使用PyPDF2库进行PDF基本操作，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3479字，纯文字阅读大概需要5分钟。

内容图文

# -*- coding =utf-8 -*-
# @Time : 2021/1/26 10:09
# @Author :Mr
# @File :pdftest.py
# @Software :PyCharm
from PyPDF2 import PdfFileReader, PdfFileWriter
import os


# 创建输出文件目录
def mkdir(read_file_path, out_path=None):
    if out_path is None:
        out_path = (os.path.join(os.path.dirname(read_file_path),
                                 os.path.basename(read_file_path)[:-4].replace(" ", "")))
    if not os.path.exists(out_path):  # 判断是否存在文件夹如果不存在则创建为文件夹
        # print("---  创建新的文件夹...  ---")
        os.makedirs(out_path)  # makedirs 创建文件时如果路径不存在会创建这个路径
        # print("---  OK  ---")
    else:
        # print("---  文件夹已存在!  ---")
        pass

    return out_path


# 切分每一页
def split_pdf(read_file_path, out_path=None):
    out_path = mkdir(read_file_path, out_path)
    pdfReader = PdfFileReader(read_file_path)
    for page in range(pdfReader.getNumPages()):
        pdf_writer = PdfFileWriter()
        pdf_writer.addPage(pdfReader.getPage(page))
        pdf_name = f'{page}.pdf'
        pdf_file = os.path.join(out_path, pdf_name)
        with open(pdf_file, 'wb') as output_pdf:
            pdf_writer.write(output_pdf)
    return


# PDF文件按条件分割
def split_by_pages(read_file_path, out_detail, out_path=None):
    out_path = mkdir(read_file_path, out_path)
    try:
        fp_read_file = open(read_file_path, 'rb')
        pdfReader = PdfFileReader(fp_read_file)  # 将要分割的PDF内容格式话
        page_count = pdfReader.getNumPages()  # 获取PDF页数
        print(page_count)  # 打印页数
        with open(out_detail, 'r', True, 'utf-8')as fp:
            # print(fp)
            txt = fp.readlines()
            # print(txt)
            for detail in txt:  # 打开分割标准文件
                # print(type(detail))
                pages, write_file = detail.split()  # 空格分组
                print(pages, write_file)
                #  write_file, write_ext = os.path.splitext(write_file)  # 用于返回文件名和扩展名元组
                pdf_file = f'{pages}页.pdf'
                pdf_files = os.path.join(out_path, pdf_file)
                print(pdf_files)
                # liststr=list(map(int, pages.split('-')))
                # print(type(liststr))
                start_page, end_page = list(map(int, pages.split('-')))  # 将字符串数组转换成整形数组
                start_page -= 1
                try:
                    print(f'开始分割{start_page}页-{end_page}页，保存为{pdf_file}......')
                    pdf_output = PdfFileWriter()  # 实例一个 PDF文件编写器
                    for i in range(start_page, end_page):
                        pdf_output.addPage(pdfReader.getPage(i))
                    with open(pdf_files, 'wb') as sub_fp:
                        pdf_output.write(sub_fp)
                    print(f'完成分割{start_page}页-{end_page}页，保存为{pdf_file}!')
                except IndexError:
                    print(f'分割页数超过了PDF的页数')
        # fp.close()
    except Exception as e:
        print(e)
    finally:
        fp_read_file.close()

    return


# 合并pdf
def merge_pdfs(out_path=None, out_file='new', *read_file_paths):
    # print(type(read_file_path))
    if not read_file_paths:
        print('请重新选择文件')
    else:
        read_file_path = read_file_paths[0]
        out_path = mkdir(read_file_path, out_path)
        pdf_name = f'{out_file}.pdf'
        output = os.path.join(out_path, pdf_name)
        pdf_writer = PdfFileWriter()
        for File in read_file_paths:
            # 依次循环打开要合并文件
            pdfReader = PdfFileReader(open(File, 'rb'))
            numPages = pdfReader.getNumPages()
            for index in range(0, numPages):
                pageObj = pdfReader.getPage(index)
                pdf_writer.addPage(pageObj)

            # 把这个已合并了的PDF文档存储起来
            with open(output, 'wb') as out:
                pdf_writer.write(out)

    return


# 删除PDF页
def delete_pdf(read_file_path, index, out_path=None):
    out_path = mkdir(read_file_path, out_path)
    pdfReader = PdfFileReader(open(read_file_path, "rb"))
    pages = pdfReader.getNumPages()
    pdf_writer = PdfFileWriter()
    pdf_file = os.path.join(out_path, f'{os.path.basename(read_file_path)[:-4].replace(" ", "")}new.pdf')
    print(pdf_file)
    for page in range(pages):
        if page + 1 in index:
            continue
        pdf_writer.addPage(pdfReader.getPage(page))
        with open(pdf_file, 'wb') as out:
            pdf_writer.write(out)

    return

内容总结

以上是互联网集市为您收集整理的python使用PyPDF2库进行PDF基本操作全部内容，希望文章能够帮你解决python使用PyPDF2库进行PDF基本操作所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/607913.html

来源：【匿名】

【上一篇】6款实用的Python编程环境！【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python使用PyPDF2库进行PDF基本操作】教程文章相关的互联网学习教程文章

python基本操作-文件、目录及路径【代码】【图】

目录1 前言2 文件夹操作2.1 查询操作2.2 创建操作2.3 删除操作2.4 修改操作3 文件操作3.1 查询操作3.2 创建操作3.3 修改操作3.4 删除4 路径操作5 示例应用5.1 批量修改文件名5.2 遍历目录及子目录下所有指定扩展名的文件5.3 按修改时间排序指定目录下的文件6 总结参考资料往期文章使用python的os模块，简单方便完成对文件夹、文件及路径的管理与访问操作。1 前言在最近开发中，经常需要对文件进行读取、遍历、修改等操作，想要快速...

python学习笔记-第一天（Linux基本操作与Python的基础）【图】

我有两台电脑,一台台式一台笔记本，笔记本是老电脑了。本机就装的kali linux。之前白天学习的时候直接在python的解释器里写的代码。但是如果要写文件的话肯定不行。所以就在台式机上弄个了elementaryos的虚拟机来写。首先说一下我的学习方法吧。那就是不停的敲，文章里面抓住重点的关键词。例如if（判断）之类的.然后不停的敲，我是一开始会记不住那么多，但是你忘记了看一下你忘记的，再敲。记得差不多了之后会报错，因为有些字符...

python学习笔记-文件基本操作（二）【代码】【图】

在上一篇文章中，简单介绍了打开文件的方法以及关于读、写、追加的操作，点击此处查看。在此篇文章中，继续介绍另外一种打开文件的方法和几种同时读写的模式。一、打开文件方法：with使用file()或open()打开文件时，最后一定要使用close()方法来关闭文件，为了避免忘记使用，还使用使用with的方法开打开文件，代码如：with open (‘文件名‘,‘模式‘) as f:... 其中，f为文件句柄，该打开文件的方式等同于f=open(‘文件名‘,‘...

Python中集合(set)的基本操作以及一些常见的用法【代码】

Python除了List、Tuple、Dict等常用数据类型外，还有一种数据类型叫做集合（set），集合的最大特点是：集合里边的元素是不可重复的并且集合内的元素还是无序的，所以一般情况下集合常用的两个场景是：1.去重（如：列表去重）；2.关系测试（如：取交集、取并集、取差集等） 1）集合包含一组无序的对象，可以使用set()函数来像下边的方式一样来创建集合#!/usr/bin/env python # -*-coding:UTF-8 -*- #创建一个数值集合 set1 = set([1...

python_函数的基本操作【代码】

1##---------------------- 函数 ---------------------- 2 3##1 定义函数 4def hello_py():5print(‘hello,python!‘)6 7hello_py()8##1.1向函数传递消息 9def get_message(username):10print(‘Hello,‘+username.title()+‘!‘)11 name=input(‘请输入你的姓名：‘)12get_message(name)13##1.2实参和形参 14‘‘‘ 15前面定义函数 get_message() 时，要求给变量 username 指定一个值。调用这个函数并提供这种16信息（人名）...

《python从入门到实践》--第四章基本操作列表重点及课后练习【代码】

题目：4-1 比萨：想出至少三种你喜欢的比萨，将其名称存储在一个列表中，再使用for 循环将每种比萨的名称都打印出来。修改这个for 循环，使其打印包含比萨名称的句子，而不仅仅是比萨的名称。对于每种比萨，都显示一行输出，如“I like pepperoni pizza”。在程序末尾添加一行代码，它不在for 循环中，指出你有多喜欢比萨。输出应包含针对每种比萨的消息，还有一个总结性句子，如“I really love pizza!”。4-2 动物：想出至少三...

python 文件的基本操作【代码】

文件的基本操作操作系统默认编码windows：gbklinux：utf-8Mac-OS：utf-8打开文件f1 = open(‘read.txt‘, encoding=‘utf-8‘,mode=‘r‘) f1变量称为文件操作句柄，通常以f1、file_handler、f_h等约定俗成形式存在。打开文件默认模式为‘r‘，省略mode参数以只读的形式打开该文件。文件打开之后必须要关闭：f1.close()。文件的读：常用读模式 r,rb,r+,r+b……读取文件模式‘r‘，mode=‘r‘，用于读取文本文件。f1.read()：整个文...

python数组的基本操作一（添加，扩展，插入）【代码】

一，创建列表创建一个列表，只要把逗号分隔的不同的数据项使用方括号括起来：member = [‘a‘,‘b‘,‘c‘,‘1‘,‘2‘,3]二，访问列表列表索引从0开始，使用下标索引来访问列表中的值：member = [‘a‘,‘b‘,‘c‘,‘1‘,‘2‘,3] print “member[0]：”， member[0]输出结果：member[0]:a三，更新列表1.append方法可以在列表后方添加一个元素:member = [‘a‘,‘b‘,‘c‘,‘1‘,‘2‘,3]member.append("python") 输出结果： [‘...

python 日志模块的基本操作

1.最简单的日志输出 https://www.cnblogs.com/yyds/p/6901864.html 先来试着分别输出一条不同日志级别的日志记录# 在控制台输出日志的两种方式: import logging logging.debug("This is a debug log.") logging.info("This is a info log.") logging.warning("This is a warning log.") logging.error("This is a error log.") logging.critical("This is a critical log.") 第二种写法logging.log(logging.DEBUG, "This is a deb...

python基本数据结构的基本操作笔记【代码】

列表list 1.index(value,[start[,stop]]): 查找值,返回索引 2.count(value): 返回列表中匹配值的次数 3.len(list): 返回元素个数 4,append(object): 列表尾部追加元素 5.insert(index,object): 在指定索引处插入元素 6.extend(iteratable): 将可迭代对象的元素追加进来,原地修改,返回None 7.remove(value): 移除列表第一个匹配的值,就地修改,返回None 8.pop([index]): 指定索引,从索引处移除元素;不指定索引,尾部移除元素 9.clear(...

SQlite在Python中基本操作

import sqlite3#创建/打开数据库需指定数据库路径，如果数据库存在则打开。不存在则创建一个新的数据库 con = sqlite3.connect(r'D:\数据库\SQLite\test.db') """ connect 返回 con 对象有以下几个方法: cursor() 创建一个游标对象 commit() 事务提交 rollback() 事务回滚 close() 关闭数据库连接 """#创建游标对象 cur = con.cursor() """ 游标对象有以下方法支持数据库操作： excute() 执行 sql 语句 executemany() 用来执行多条...

python的基本操作运算符【代码】

#幂次运算 ** mici = 1 while mici <= 9:print(2**mici,end=" ") #打印2的n次幂mici += 1 #取整运算 // print("\n取整运算：5//3 = ",5//3) 逻辑运算：或：or 与:and 非:not 优先级问题：有括号先算括号里边的，算完括号里边的，先算not ,再算and，最后算or 如果出现x or y,当x是0的时候输出结果就是y，否则就是x 如果出现x and y，当x是0的时候，输出的是0，如果不是0,输出的就是y print(3 or 2) print(0 or 2 or 3 or 4) prin...

python列表的基本操作有哪些【代码】【图】

python列表的基本操作有：1、创建列表，只要把逗号分隔的不同的数据项使用方括号括起来；2、添加新的元素；3、遍历列表；4、访问列表中的值；5、从list删除元素。相关免费学习推荐：python教程（视频）python列表的基本操作有：主要介绍了Python中列表(List)的详解操作方法,包含创建、访问、更新、删除、其它操作等,需要的朋友可以参考下。1、创建列表。只要把逗号分隔的不同的数据项使用方括号括起来即可 List = [wade,james,bosh...

python字典基本操作有哪些【代码】【图】

字典是python中五中基本数据类型之一，虽然它的赋值稍微麻烦点，但用起来真的是很方便。它用键值对来存放数据，所谓键值对，就是一个键，对应一个值，如果后面对前面的键再次赋值，第一次的值就被覆盖掉。1：字典的创建我们知道，python中列表用‘[]’表示，元祖用‘()’表示，字典用的是{}表示，创建较列表、元祖、字符串来说较为麻烦点，但只要记住键值对这三个字，就能正确创建一个字典类型的变量的，看下面代码d = {a: 我是a, ...

Selenium+PhantomJs解析渲染Js的基本操作【图】

有人说Selenium库和PhantomJ，说他们结合使用是万能的利器。那么，他们真的那么厉害吗，我们一起来看看Selenium库的用法吧。通过这篇文章让我们来看一下Selenium库结合PhantomJs，Chrome等一些浏览器的操作吧。什么是SeleniumSelenium是一个自动化测试工具，支持包括Chrome，Firefox，Safari，PhantomJs等一些浏览器。如果用于爬虫中，我们主要用来解决一些JavaScript渲染的问题。我们在使用Requests库去请求一些网页的时候，比如 ...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python使用PyPDF2库进行PDF基本操作

python使用PyPDF2库进行PDF基本操作

内容导读

内容图文

内容总结

内容备注

内容手机端

【python使用PyPDF2库进行PDF基本操作】教程文章相关的互联网学习教程文章

python基本操作-文件、目录及路径【代码】【图】

python学习笔记-第一天（Linux基本操作与Python的基础）【图】

python学习笔记-文件基本操作（二）【代码】【图】

Python中集合(set)的基本操作以及一些常见的用法【代码】

python_函数的基本操作【代码】

《python从入门到实践》--第四章基本操作列表重点及课后练习【代码】

python 文件的基本操作【代码】

python数组的基本操作一（添加，扩展，插入）【代码】

python 日志模块的基本操作

python基本数据结构的基本操作笔记【代码】

SQlite在Python中基本操作

python的基本操作运算符【代码】

python列表的基本操作有哪些【代码】【图】

python字典基本操作有哪些【代码】【图】

Selenium+PhantomJs解析渲染Js的基本操作【图】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程