python数据处理（二）之处理pdf文件

时间：2020-03-30 23:50:05 阅读：124 评论：0 收藏：0 [点我收藏+]

1.前言

尽可能地寻找可以提到pdf格式的数据

2.解析pdf的编程方法

2.1 利用slate库打开并读取PDF

2.2 将PDF转换成文本

3 利用pdfminer解析PDF

4 学习解决问题的方法

4.1 使用表格提取 pdftables

4.2 手动清洗数据

4.3 使用Tabula

原文：https://www.cnblogs.com/qiu-hua/p/12602065.html

踩

(0)

评论一句话评论（0）

分享档案

更多>