Pandas-reindex 中关于填充缺失值的几个方法
在学习 Pandas 时,当对一个 Series 或者 DataFrame 进行重新索引时,需要用到 pandas.Series.reindex()或者 pandas.DataFrame.reindex()。当某个索引值不存在时,会直接引入缺失值 NaN。我们可以通过填充的方式,使 Series 或者 DataFrame 中新的 index 拥有新的索引。这篇文章整理下 reindex 中关于填充缺失值的几个方法
索引对象是无法修改的,因此,重新索引是指对索引重新排序而不是重新命名,如果某个索引值不存在的话,会引入缺失值
obj.reindex([‘a’,‘b’,‘c’,‘d’,‘e’]) #重新填充
对于重建索引引入的缺失值,可以利用 fill_value 参数填充。
对于顺序数据,比如时间序列,重新索引时可能需要进行插值或填值处理,利用参数 method 选项可以设置:
method = ‘ffill’或‘pad’,表示前向值填充 (# 根据前面的值填充)
method = ‘bfill’或‘backfill’,表示后向值填充(# 根据后面的值填充)