表格处理:多表格汇总
很多项目中我们不可避免的要对一些表格进行处理,而很多机构下又有很多支行,各支行下载的数据源表格一般格式都是一致的,在对表格进行一些逻辑操作之前,我们需要先将个支行下的表格汇总成一张总表。
测试之前,我新建了一张测试表格,sheet1 和 sheet2 截图如下:
新建了 3 张测试表格,result 作为结果表
然后下面贴代码:
import xlrd
import xlsxwriter
# 待合并excel
allxls = [r"D:\depthsdata\test\1.xlsx",r"D:\depthsdata\test\2.xlsx",r"D:\depthsdata\test\3.xlsx"]
# 目标excel
end_xls = r"D:\depthsdata\test\result.xlsx"
def open_xls(file):
try:
fh = xlrd.open_workbook(file)
return fh
except Exception as e:
print("打开文件错误:" + e)
# 根据excel名以及第几个标签信息就可以得到具体标签的内容
def get_file_value(filename, sheetnum):
rvalue = []
fh = open_xls(filename)
sheet = fh.sheets()[sheetnum]
row_num = sheet.nrows
for rownum in range(0, row_num):
rvalue.append(sheet.row_values(rownum))
return rvalue
# 获取第一个excel的sheet个数以及名字作为标准
first_file_fh = open_xls(allxls[0])
first_file_sheet = first_file_fh.sheets()
first_file_sheet_num = len(first_file_sheet)
sheet_name = []
for sheetname in first_file_sheet:
sheet_name.append(sheetname.name)
# 定义一个目标excel
endxls = xlsxwriter.Workbook(end_xls)
all_sheet_value = []
# 把所有内容都放到列表all_sheet_value中
for sheet_num in range(0, first_file_sheet_num):
all_sheet_value.append([])
for file_name in allxls:
print("正在读取" + file_name + "的第" + str(sheet_num + 1) + "个标签...")
file_value = get_file_value(file_name, sheet_num)
all_sheet_value[sheet_num].append(file_value)
# print(all_sheet_value)
num = -1
sheet_index = -1
# 将列表all_sheet_value的内容写入目标excel
for sheet in all_sheet_value:
sheet_index += 1
end_xls_sheet = endxls.add_worksheet(sheet_name[sheet_index])
num += 1
num1 = -1
for sheet1 in sheet:
for sheet2 in sheet1:
num1 += 1
num2 = -1
for sheet3 in sheet2:
num2 += 1
# print(num,num1,num2,sheet3)
# 在第num1行的第num2列写入sheet3的内容
end_xls_sheet.write(num1, num2, sheet3)
endxls.close()
结果表显示如图:
火影少女嘻嘻嘻
👍🏻,不过这个用 pandas 感觉会简单点吧😁
使用 pandas 表格数据 dataframe,代码量很少 ,xlwings 也比 xlrd 简洁
学习,不明觉厉,原来是火影粉啊,啊哈哈哈