python使用PyPDF2库pdf文件转excel文件

🗓️ 创建于2023年08月25日(最后编辑于1070天前)

👁️ 阅读557次

首页现代魔法正文

代码如下：
缺点：只适用于PDF文档中的表格格式较为规范的情况，对于复杂的表格格式可能无法正确处理。

import PyPDF2

def convert_pdf_to_excel(pdf_path, excel_path):
    pdf_file = open(pdf_path, 'rb')
    pdf_reader = PyPDF2.PdfReader(pdf_file)
    excel_file = open(excel_path, 'w')

    for page_num in range(len(pdf_reader.pages)):
        page = pdf_reader.pages[page_num]
        text = page.extract_text().encode('cp950', errors='ignore').decode('cp950')
        excel_file.write(text)

    pdf_file.close()
    excel_file.close()

# 使用示例
pdf_path = 'example.pdf'  # 替换成你的PDF文件路径
excel_path = 'output.xlsx'  # 替换成输出Excel文件路径
convert_pdf_to_excel(pdf_path, excel_path)

#Python

测试中常用符号代表意思

Python常见的各种加密解密算法

搜索

第一百零一次闯荡江湖的无名游侠