pandas 场景需求处理

需求:
1. 给无头表添加标题头
2. 定位表格中不包含特殊关键词的行
3. 对比表格信息,不同部分分别输出保存到新表。

import pandas as pd


def compare():
    # 添加header内容
    name = ["header_names"]
    df = pd.read_excel(file_path, header=None, names=name)

    df = df.loc[~df["header"].str.contains("aim_content")]

    # 表1行数
    line_num = df.shape[0]

    # 表2行数
    df_rh = pd.read_excel("file_path")
    rh_num = df_rh.shape[0]


    # 表格对比
    cop_t = df["header"].values.tolist()
    cop_rh = df_rh["header"].values.tolist()

    a = [x for x in cop_t if x not in cop_rh]
    b = [x for x in cop_rh if x not in cop_t]

    df_t598_final = df.loc[df["header"].isin(a)]
    df_rh_final = df_rh.loc[df_rh["header"].isin(b)]
    print(df_rh_final)

    # 得到结果, 重命名新表header
    df_one, df_two = pd.DataFrame(), pd.DataFrame()
    df_one["header"] = df_t598_final["header"]
    df_one["header"] = df_t598_final["header"]

    df_two["header"] = df_rh_final["header"]
    df_two["header"] = df_rh_final["header"]

    df_one.to_excel("file_path")
    df_two.to_excel("file_path")
    print("OK")


if __name__ == "__main__":
    compare()