pandas 获取相似列名的所有数据

在数据分析中,可能我们会遇到多个列名相似的内容,需要我们取出来。

类似下面这这种:

num, start_time, star, area, apple_fruit, orange_fruit, banana_fruit

这些列名中,我们要取出所有的水果列,可以采用下面的方法。这和 data[''] 取列不同,因为这里是只知道部分列名内容。

代码

#!/usr/bin/env Python3
__author__ = '未昔/angelfate'
__date__ = '2019/8/9 9:31'
# -*- coding: utf-8 -*-

import pandas as pd


data = pd.read_csv(r'E:\python\Study\data_\CarCon0.csv',encoding='gbk',engine='python')

# 获取以 "_num" 结尾的各列数据
col_names = data.columns.tolist()
print(col_names)

milligram_columns = []

for items in col_names:
    if items.endswith("_num"):
        milligram_columns.append(items)
milligram_df = data[milligram_columns]
print(milligram_df)

结果:

pandas 获取相似列名的所有数据