"想知道如何利用 PYTHON 筛选 EXCEL 表里面的重复值,并显示重复值"
想知道如何利用 PYTHON 筛选 EXCEL 表里面的重复值,并显示重复值
pandas 中 drop_duplicates 为我们提供了数据去重的方法,实现步骤:1. 采用 drop_duplicates 对数据去两次重,一次将重复数据全部去除(keep=False)记为 data1,另一次将重复数据保留一个(keep=’first)记为 data2;2. 求 data1 和 data2 的差集,即可:data2.append(data1).drop_duplicates(keep=False)
【读取 excel】组件读出 excel 的数据,再用 pandas 进行筛选重复值
pandas 中 drop_duplicates 为我们提供了数据去重的方法,实现步骤:
1. 采用 drop_duplicates 对数据去两次重,一次将重复数据全部去除(keep=False)记为 data1,另一次将重复数据保留一个(keep=’first)记为 data2;
2. 求 data1 和 data2 的差集,即可:data2.append(data1).drop_duplicates(keep=False)
【读取 excel】组件读出 excel 的数据,再用 pandas 进行筛选重复值