Excel 去除重复项
在测试过程中,会经常遇到多张表格筛选比对的过程,筛选出的结果导入到一张新表,往往新表中会有许多重复项,我们需要清除这些重复的项,只留下唯一的项即可。
我们可以利用 pandas 库中的 drop_duplicates 方法实现。
函数用法:DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
参数
这个 drop_duplicate 方法是对 DataFrame 格式的数据,去除特定列下面的重复行。返回 DataFrame 格式的数据。
subset : 用来指定特定的列,默认所有列
keep : 删除重复项并保留第一次出现的项
inplace:默认 False,在原来数据上修改
例子:
表 a 中标黄的位置为重复项
我们通过以下流程,将表 a 去重,随后插入到 b 表中。
最后表 b 得到的结果:
这样表格去重就完成了。
不错,继续分享。