"pandas 工具 excel 的行列转换处理学习笔记 import pandas as pd import os abs_path = os.path.abspath(‘.’) file_path = os.path.join(abs_p ...."

那人那山那块饼干

Rpa 12470 号会员
Pandas • 2 回帖 • 905 浏览 • 2021-04-25 10:28:15

pandas 行列转换 - 学习笔记

pandas 工具 excel 的行列转换处理学习笔记

import pandas as pd
import os
abs_path = os.path.abspath(‘.’)
file_path = os.path.join(abs_path,‘df_test.xlsx’)
aaa = pd.read_excel(file_path)
aaa 如图：

new_aaa = aaa.T
new_aaar 如图：

df = aaa.set_index(‘产品名称’)
df = df.stack()
df.index = df.index.rename(‘info’,level=1)
df.name =‘res’
df = df.reset_index()
print(df)
df 如图：

set_index 重新设置索引，stack()多级化索引，并将数据框（DataFrame）转换成序列（Series）。转置后，再用 reset_index() 将数据框还原成普通的二维表。

unstack 也是多级化索引，区别在于：stack 会把 None 自动过滤，unstack 保留 None 的数据

melt 也可以快速实现

df2 = pd.melt(aaa,id_vars=['产品代码'],var_name = '信息',value_name='xinxi')
这里的 id_vars 指列名，可以指定多个列名。这样显示的行数会减少，但列会多出多个。

df2 如图:

一般因此会结合排序进行
df2.sort_values(by=['产品代码'])