pandas 场景需求处理
需求:
1. 给无头表添加标题头
2. 定位表格中不包含特殊关键词的行
3. 对比表格信息,不同部分分别输出保存到新表。
import pandas as pd
def compare():
# 添加header内容
name = ["header_names"]
df = pd.read_excel(file_path, header=None, names=name)
df = df.loc[~df["header"].str.contains("aim_content")]
# 表1行数
line_num = df.shape[0]
# 表2行数
df_rh = pd.read_excel("file_path")
rh_num = df_rh.shape[0]
# 表格对比
cop_t = df["header"].values.tolist()
cop_rh = df_rh["header"].values.tolist()
a = [x for x in cop_t if x not in cop_rh]
b = [x for x in cop_rh if x not in cop_t]
df_t598_final = df.loc[df["header"].isin(a)]
df_rh_final = df_rh.loc[df_rh["header"].isin(b)]
print(df_rh_final)
# 得到结果, 重命名新表header
df_one, df_two = pd.DataFrame(), pd.DataFrame()
df_one["header"] = df_t598_final["header"]
df_one["header"] = df_t598_final["header"]
df_two["header"] = df_rh_final["header"]
df_two["header"] = df_rh_final["header"]
df_one.to_excel("file_path")
df_two.to_excel("file_path")
print("OK")
if __name__ == "__main__":
compare()