Excel 去除重复项

在测试过程中,会经常遇到多张表格筛选比对的过程,筛选出的结果导入到一张新表,往往新表中会有许多重复项,我们需要清除这些重复的项,只留下唯一的项即可。
我们可以利用 pandas 库中的 drop_duplicates 方法实现。

函数用法:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数
这个 drop_duplicate 方法是对 DataFrame 格式的数据,去除特定列下面的重复行。返回 DataFrame 格式的数据。

subset : 用来指定特定的列,默认所有列

keep : 删除重复项并保留第一次出现的项

inplace:默认 False,在原来数据上修改

例子:
表 a 中标黄的位置为重复项
Excel 去除重复项

我们通过以下流程,将表 a 去重,随后插入到 b 表中。
Excel 去除重复项

最后表 b 得到的结果:
Excel 去除重复项

这样表格去重就完成了。