我有一个数据框df
和一个字符串列表cols_needed
,它们指示要保留的列df
。中的列名df
与中的字符串不完全匹配cols_needed
,因此我不能直接使用intersection
。但是列名称确实包含中的字符串cols_needed
。我尝试玩耍,str.contains
但无法正常工作。我如何df
基于cols_needed
?
import pandas as pd
df = pd.DataFrame({
'sim-prod1': [1,2],
'sim-prod2': [3,4],
'sim-prod3': [5,6],
'sim_prod4': [7,8]
})
cols_needed = ['prod1', 'prod2']
# What I want to obtain:
sim-prod1 sim-prod2
0 1 3
1 2 4
随着regex
的选项filter
df.filter(regex='|'.join(cols_needed))
sim-prod1 sim-prod2
0 1 3
1 2 4
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句