"[链接]选取多列内容为指定内容的行 import pandas as pd data= pd.read_excel('summary_table.xlsx') [链接]1、把所有列‘客户类别’内容为 8.0 和 9.0 的改成 ...."

经验动态下载提问活动应用互动学院最新优选官网

登录

wangwei

机器学习, 数据采集, 数据分析, web网站，IS-RPA，APP
python基础 python Pandas 数据处理 • 3 回帖 • 23.3K 浏览 • 2019-07-10 14:30:44

选取多列内容为指定内容的行

选取多列内容为指定内容的行

import pandas as pd

data= pd.read_excel('summary_table.xlsx')

1、把所有列‘客户类别’内容为 8.0 和 9.0 的改成 8 和 9:

for i in range(len(data)):
    if data['客户类别'][i] == 8.0:
        data['客户类别'][i]  = int(data['客户类别'][i])
    elif data['客户类别'][i] == 9.0:
        data['客户类别'][i] = 9

2、把所有‘结售类型’列的内容后面有 \t 的替换掉：

# 数据预处理,把 \t 的内容去掉
for num in range(len(data)):
    data['结售类型'][num] = data['结售类型'][num].replace("\t",'')

3、选取某列为指定内容的所有行数据：

选取所有 ‘客户类型’列 = 8.0 或者 = 9.0，且‘结售类型’=5 或 6 的数据。

# 选取等于某些值的行记录 用 == 
# data.loc[data['客户类别']==8.0]
data2 = data.loc[data['客户类别'].isin([8.0,9.0]) & data['结售类型'].isin(['5','6'])]

4、数据存储:

# 存储
data2.to_excel('new_data00.xlsx',index=False)

完整代码：

import pandas as pd

# 数据读取
data= pd.read_excel('summary_table.xlsx')

# 数据预处理,把 \t 的内容去掉
for num in range(len(data)):
    data['结售类型'][num] = data['结售类型'][num].replace("\t",'')
    
    
# 选取等于某些值的行记录 用 == 
# data.loc[data['客户类别']==8.0]
data2 = data.loc[data['客户类别'].isin([8.0,9.0]) & data['结售类型'].isin(['5','6'])]

# 存储
data2.to_excel('new_data00.xlsx',index=False)

Pandas 自定义表头方法：

data_headers = ['name','start_time','end_time','company','doctor','act','doctor','type_','pf','area']
data3 = pd.DataFrame(items,index=Fasle,columns=data_headers) # 没说不可以有头信息
data3.head()

3 回帖

Apollo • 2020-01-31 16:29:55 3楼

👍

0 0 0

wangwei • 2019-07-11 09:41:35 2楼

💯

0 0 0

gurongrong • 2019-07-11 09:10:13 1楼

👍

1 回复 0 0 0

快速了解RPA

RPA RPA技术 RPA软件 RPA培训 RPA应用 RPA机器人

沪ICP备12049238号版权所有©上海艺赛旗软件股份有限公司 2011-2018
© 2018 B3log 开源旗下云南链滴科技有限公司版权所有 • Sym

选取多列内容为指定内容的行

0 0 1 0