我有一列pandas数据框(df
)。看起来像这样:
Mese
__________
{12313}Luglio
{34}Maggio
我正在尝试使用正则表达式来摆脱{}
和之间的所有内容:
df['Mese']=[re.sub(r'^{d+}','', str(x)) for x in df['Mese']]
这是行不通的。有什么帮助吗?
您需要使用Series.str.replace
与^\{\d+}
模式:
df['Mese'] = df['Mese'].str.replace(r'^\{\d+}', '')
熊猫测试:
>>> import pandas as pd
>>> df = pd.DataFrame({'Mese':['{12313}Luglio','{34}Maggio']})
>>> df['Mese'] = df['Mese'].str.replace(r'^\{\d+}', '')
>>> df
Mese
0 Luglio
1 Maggio
该^\{\d+}
模式匹配花括号内的一些字符串的开始。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句