dataframe 常用操作

dataframe 常用操作
1. 返回数据的行数
df.shape[0]
2. 给某一列 / 某些列改名
df = df.rename(columns={‘treatment’:‘treatment_label’})
3. 筛选
df_t = df[df[‘treatment_label’]==1]
4. 去掉某一列或某些列
df_train=df_train.drop(columns=[‘treatment_group_key’])
5.float 转 int
df[‘Class’] = df[‘Class’].astype(int)
6. 把两个列名一样的 df 竖直拼接起来
df = df_c.append(df_t_use, ignore_index=True)
7. 增加列
df[‘列名称’] = list_data
8. 增加行
df.iloc[1] = list_data # 在索引为 1 的位置插入行
9. 取行 ——单行
df[1:2] # 取第二行
df.loc[‘行名称’] # 取指定行
df[2, :] # 取第三行
10. 取行 ——多行
df.loc’行名称 1’, ’行名称 2’ # 取指定多行
df.iloc[:2, :] # 取前两行
11. 取列 ——单列
df[‘列名’] # 取指定列
df. 列名 # 取指定列
df.iloc[:, 列序号] # 取指定列
12. 取列 ——多列
df[‘列名 1’, ‘列名 2’] # 取指定多列
df.iloc[:, :3] # 取前三列
13. 取元素
df.loc[‘行名’, ‘列名’] # 取指定行列的元素
df.iloc[‘行序号’, ‘列序号’] # 取指定行列的元素
14. 取多行多列
df.iloc[:2, :3] # 取前两行,前三列
df.loc[[‘行名 1’, ‘行名 2’], [‘列名 1’, ‘列名 2’]] # 取指定行列的元素