python的​PyPDF2實現pdf文件切割和合並

今天想使用pdf的切分軟件實現pdf文件的切分,但是軟件需要會員???好吧,,,,又要會員,這麼簡單的功能能難倒咱們程序員嗎。俗話說自給自足豐衣足食,決定使用python自己切分文件。

在百度瞭一番後,發現大多都是使用 Adobe Acrobat 軟件進行剪裁,這完全不 Pythonic,因此又找瞭用 Python 處理 PDF 文件的方法,最後發現瞭 PyPDF2 這個庫,本文將利用這個庫,實現對 PDF 的分割。

首先,你需要通過 pip 安裝這個庫:

pip install PyPDF2

要使用python的

# 導入讀寫pdf模塊
from PyPDF2 import PdfFileReader, PdfFileWriter
'''
註意:
頁數從0開始索引
range()是左閉右開區間
'''
 
def split_pdf(file_name, start_page, end_page, output_pdf):
    '''
    :param file_name:待分割的pdf文件名
    :param start_page: 執行分割的開始頁數
    :param end_page: 執行分割的結束位頁數
    :param output_pdf: 保存切割後的文件名
    '''
    # 讀取待分割的pdf文件
    input_file = PdfFileReader(open(file_name, 'rb'))
    # 實例一個 PDF文件編寫器
    output_file = PdfFileWriter()
    # 把分割的文件添加在一起
    for i in range(start_page, end_page):
        output_file.addPage(input_file.getPage(i))
    # 將分割的文件輸出保存
    with open(output_pdf, 'wb') as f:
        output_file.write(f)
 
def merge_pdf(merge_list, output_pdf):
    """
    merge_list: 需要合並的pdf列表
    output_pdf:合並之後的pdf名
    """
    # 實例一個 PDF文件編寫器
    output = PdfFileWriter()
    for ml in merge_list:
        pdf_input = PdfFileReader(open(ml, 'rb'))
        page_count = pdf_input.getNumPages()
        for i in range(page_count):
            output.addPage(pdf_input.getPage(i))
 
    output.write(open(output_pdf, 'wb'))
 
 
if __name__ == '__main__':
    # 分割pdf
    split_pdf("test.pdf", 0, 3, "0-2.pdf")
    split_pdf("test.pdf", 7, 12, "7-11.pdf")
    split_pdf("test.pdf", 18, 23, "18-22.pdf")
    split_pdf("test.pdf", 27, 33, "26-32.pdf")
    split_pdf("test.pdf", 40, 44, "40-43.pdf")
    split_pdf("test.pdf", 46, 51, "46-50.pdf")
    split_pdf("test.pdf", 58, 66, "58-65.pdf")
    split_pdf("test.pdf", 77, 84, "77-83.pdf")
    split_pdf("test.pdf", 93, 97, "93-96.pdf")
    split_pdf("test.pdf", 102, 106, "102-105.pdf")
    # 合並pdf
    # 合並的pdf列表
    pdf_list = ["0-2.pdf", "7-11.pdf", "18-22.pdf", "26-32.pdf", "40-43.pdf", "46-50.pdf", "58-65.pdf", "77-83.pdf", "93-96.pdf", "102-105.pdf"]
    merge_pdf(pdf_list, "all.pdf")

下面是切分好的文件效果,完美 

到此這篇關於python的​PyPDF2實現pdf文件切割和合並的文章就介紹到這瞭,更多相關python PyPDF2實現pdf剪裁內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: