简介:

.docx 文件结构在 python-docx 中的三种类型:

Document 对象表示整个文档;Paragrapha 对象标识段落(在输入文档,每一次回车产生新段落);Run 对象标识相同样式的文本延续。

Document 对象包含一个 Paragrapha 对象的列表,Paragraph 对象包含一个 Run 对象的列表。

 

文档内容:

 

 

 

 

0、准备工作

   0.1 安装包

pip  install  python-docx

  0.2 导入相关包

import os
import re
import docx  

  0.3 工作路径设置

work_path = \'E:\\pyspace\\wdocuments\'

os.chdir(work_path)

 

1、读取 word 文档

doc = docx.Document(\'python  演示文档.docx\')  # Document 对象
len(doc.paragraphs)  # Paragraph 对象列表的长度

 

 2、 paragraph 对象

for i, para in enumerate(doc.paragraphs):
    print(f\'No.{i+1}\n\', para.text, sep=\'\')

 

 3、run 对象

for i, para in enumerate(doc.paragraphs):
    for j, run in enumerate(para.runs):
        print(f\'Para.{i+1} Run{j+i}:  \', run.text, sep=\'\')

 

 

 

版权声明:本文为shanger原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/shanger/p/13093287.html