python Word 表格转 Excel

word 转 excel 代码块分享:
使用前需要手动安装一下 python-docx 注意不是直接安装 doxc,目前 docx 好像没兼容 py3x,步骤如下

进入网址https://www.lfd.uci.edu/~gohlke/pythonlibs/
CTRL+F 查找 python_doxc 下载 python_docx‑0.8.10‑py2.py3‑none‑any.whl
版本号可能会有变化无所谓
进入命令窗口 cd 到下载的 whl 文件目录下,输入命令
pip install python_docx-0.8.10-py2.py3-none-any.whl
python Word 表格转 Excel

代码如下:

from docx import Document
import pandas as pd
   
def word_to_excel(word_path, excel_path):
  word_lis = []
  doc = Document(word_path)
  for tb in doc.tables:  # 遍历多个表
	  for row in tb.rows:  # 遍历表的每一行
		  li = []
		  for cell in row.cells:  # 遍历每一行的单元格
			  text = ""
			  for p in cell.paragraphs:   # 遍历单元格中的每一段(回车符)
				  text += p.text
			  li.append(text)
		  word_lis.append(li)

  # list转dataframe
  df = pd.DataFrame(word_lis)

  # 保存到本地excel
  df.to_excel(excel_path, index=False, header=0)  # 若不需要将第一行设为表头 header = None
# 执行方法
word_path = 'D:\\wordtoexcel\\wordtoexcel.docx'
excel_path = 'D:\\wordtoexcel\\wordtoexcel.xlsx' 

word_to_excel(word_path, excel_path)

运行结果展示
python Word 表格转 Excel

python Word 表格转 Excel