https://blog.csdn.net/HUSTER_LC/article/details/79367286
1、遇到问题
工作中遇到一个问题,需要从dcox文档中抽取特定的段落;通过对目标对象的调查,发现目标段落的公共特性:具有同样的段落样式,并且有共同的开头Sysname;
同时存在另外一个问题,存在多个目标文档,且这些目标文档存在同一个目标文件夹中
2、解决方案
先解决问题1:获取指定路劲下的特定文档的目标段落
在解决问题2 :获取指定路径下的docx文档的列表
1、问题 1 :
使用python docx 获取目标文档的目标段落并使用re模块查找包含Syname的段落
2、问题 2:
使用os改变工作路径,并获取特定路劲下的文档列表,送给1进行处理
3、实施
1、打开目标文档,获取目标段落
2、将查找到的段落写入txt文件
3、工作目录切换与获取指定路径的文档列表
使用python从docx中抽取特定段落并保存到txt文档中
原文:https://www.cnblogs.com/ein-key5205/p/12316212.html