高手过招第 6 期—项目中常见文件处理合集分享

生成和修改常用文本操作

python 生成 word、ppt 操作源码分享

自制 txt 项目流程执行日志并邮件报送

word 文件内容批量匹配并标注(修改字体样式)

from docx import Document

from docx.shared import RGBColor, Pt, Cm
import os
import glob

def pipei(file_path,keyword):

    if not os.path.exists(file_path):
        os.mkdir(file_path)


    for file in glob.glob(file_path + '\*.docx'):
        docx = Document(file)
        for paragraph in docx.paragraphs:
            print('段落:',paragraph.text)

            for run in paragraph.runs:
                print(run.text)
                if keyword in run.text:
                    run.font.bold = True
                    run.font.color.rgb = RGBColor(255, 0, 0)

        docx.save(file_path + '/' + os.path.basename(file))
    
    

正则清洗、匹配文本

正则 sub 去除字符串空格及 n

正则匹配千分位金额

表格文件常用的处理分享

python 写入 Excel 遇到 Exception: Attempt to overwrite cell

wps 可能执行写入操作后为不关闭进程出现自动创建副本的情况,影响再次写入,这里推荐杀死 wps 进程python 代码强行杀死进程

DataFrame 直接进行行列转换

OpenPyXL 的简单使用

openpyxl 修改单元格格式(隐藏小数、设定百分数位数)

使用 openpyxl 工具包获取索引(数组)对应表格列(字母)

修改表格 sheet 名时不确定原名称,直接根据 sheet 索引进行修改

使用 pandas 分块处理大文件

以上帖子均可在小白主页中查找,欢迎小伙伴回帖讨论 ~

高手过招第 6 期—项目中常见文件处理合集分享

活动传送门 【高手过招】 高手过招 06 期 – 常用文件的处理方法及技巧分享