1.前言
尽可能地寻找可以提到pdf格式的数据
2.解析pdf的编程方法
2.1 利用slate库打开并读取PDF
2.2 将PDF转换成文本
3 利用pdfminer解析PDF
4 学习解决问题的方法
4.1 使用表格提取 pdftables
4.2 手动清洗数据
4.3 使用Tabula
python数据处理(二)之处理pdf文件
原文:https://www.cnblogs.com/qiu-hua/p/12602065.html