python Word 表格转 Excel
word 转 excel 代码块分享:
使用前需要手动安装一下 python-docx 注意不是直接安装 doxc,目前 docx 好像没兼容 py3x,步骤如下
进入网址https://www.lfd.uci.edu/~gohlke/pythonlibs/
CTRL+F 查找 python_doxc 下载 python_docx‑0.8.10‑py2.py3‑none‑any.whl
版本号可能会有变化无所谓
进入命令窗口 cd 到下载的 whl 文件目录下,输入命令
pip install python_docx-0.8.10-py2.py3-none-any.whl
代码如下:
from docx import Document
import pandas as pd
def word_to_excel(word_path, excel_path):
word_lis = []
doc = Document(word_path)
for tb in doc.tables: # 遍历多个表
for row in tb.rows: # 遍历表的每一行
li = []
for cell in row.cells: # 遍历每一行的单元格
text = ""
for p in cell.paragraphs: # 遍历单元格中的每一段(回车符)
text += p.text
li.append(text)
word_lis.append(li)
# list转dataframe
df = pd.DataFrame(word_lis)
# 保存到本地excel
df.to_excel(excel_path, index=False, header=0) # 若不需要将第一行设为表头 header = None
# 执行方法
word_path = 'D:\\wordtoexcel\\wordtoexcel.docx'
excel_path = 'D:\\wordtoexcel\\wordtoexcel.xlsx'
word_to_excel(word_path, excel_path)
运行结果展示
回帖内容已被屏蔽。
这就已经很实用啦
那个是真的难搞哈哈哈
是那种带点选的 WORD 表格,上个帖子我发了
先执行宏再删除宏不行吗?
这段代码只适用于处理 word 常规表格了
对我的 VBA 宏控件表格没有半点用,失败的尝试
嗨,敲了不能浪费,分享给大家啦
希望官方下个版本出的 word 组件能够强大点 🙏