【DataFrame】对某列应用正则表达式生成另一列
假设有如下的 DataFrame:
现在需要增加一列,名字为选择原因,内容为在经营范围中进行搜索,如果发现含有设备、汽车、网络
中的任何一个词的,就在选择原因中写上这个搜索到的词,否则不填。
我们可以对列调用 apply 方法,使用正则表达式来进行匹配,假设 DataFrame 名称为 df,代码如下:
import re
pattern = r'设备|汽车|网络'
# 一行超人
df['选择原因'] = df['经营范围'].apply(lambda s: ''.join(set(re.findall(pattern, s))) if re.findall(pattern, s) else '')