"在数据分析中，可能我们会遇到多个列名相似的内容，需要我们取出来。类似下面这这种： num, start_time, star, area, apple_fruit, orange_fruit, banana_fruit 这些列名中，我们要 ...."

wangwei

机器学习, 数据采集, 数据分析, web网站，IS-RPA，APP
其他经验 python基础 Pandas • 3 回帖 • 1.9K 浏览 • 2019-08-09 09:41:30

pandas 获取相似列名的所有数据

在数据分析中，可能我们会遇到多个列名相似的内容，需要我们取出来。

类似下面这这种：

num, start_time, star, area, apple_fruit, orange_fruit, banana_fruit

这些列名中，我们要取出所有的水果列，可以采用下面的方法。这和 data[''] 取列不同，因为这里是只知道部分列名内容。

代码

#!/usr/bin/env Python3
__author__ = '未昔/angelfate'
__date__ = '2019/8/9 9:31'
# -*- coding: utf-8 -*-

import pandas as pd


data = pd.read_csv(r'E:\python\Study\data_\CarCon0.csv',encoding='gbk',engine='python')

# 获取以 "_num" 结尾的各列数据
col_names = data.columns.tolist()
print(col_names)

milligram_columns = []

for items in col_names:
    if items.endswith("_num"):
        milligram_columns.append(items)
milligram_df = data[milligram_columns]
print(milligram_df)