RPA 处理 TXT 文本技巧

在 RPA 的一些场景会碰到需要从 TXT 文本文件提取需要的表格,TXT 文本并没有固定的格式,所以基本上每一个不同的 TXT 文本都需要单独写程序,下面是一些我在项目中用到的 TXT 文本处理技巧。
有用到的 Python 处理 TXT 代码:
#打开 TXT 文本
file_new =`open(‘*.txt’,‘r’)
#逐行读取 TXT 文本内容
info=file_new.readlines()
#按空格逐行分解每一行数据
for ls in info:
info_list = ls.strip()
#关闭 TXT 文本
file_new.close()
由于 TXT 文本并没有固定的格式,所以基本上不可能碰到可以重复复用的 TXT 公式,灵活运用上面的公式,或者也可以使用一些 Python 的第三方库来辅助。每当我们拿到一个 TXT 文本数据时,首先要做的事和客户沟通确定该文本的样式和瞄点,总结规律,比如通过定位 TXT 文本中的唯一值来定位所需求的数据,或者为什么我们要逐行读取 TXT 文本,因为大部分 TXT 文本都是有固定的行和列,举个例子:
CITIC INDUSTRIAL BANK
外卡收单 M/C 资金清算报表

报表号码: 报表日期 2018-08-15 货币 840

交易类型 笔数 交易金额 手续费收入 手续费支出 结算金额 其他金额 清算日期
ATM 59 12237.53 97.63 12335.16 0.00 2018-08-14
合计: 59 12237.53 97.63 0.00 12335.16 0.00
* * * 报表结束 * * *
如上的 TXT 文档,我们需要读取合计一栏的结算金额,我先逐行读取 TXT 表格,然后瞄定‘合计‘(此值唯一),然后用 split 函数分割数据,取分割后得到的列表的倒数第 3 个数据就是结算金额了。