こんにちは私はデータフレーム値内の特定の用語を見つけて、辞書キーと照合することによってそれらを置き換えたいと思います。
データフレーム:
Search term Application
safe high school trip 1
spring break trips 2
gap year trips 1
辞書に置き換えたい単語のリストがあります。キーは検索する用語であり、値に置き換えます。
{'high school': ['high-school'],
'spring break': ['spring-break'],
'gap year': ['gap-year']}
アイデアの出力:
Search term Application
safe high-school trip 1
spring-break trips 2
gap-year trips 1
データフレーム値内の文字列の一部を置き換える方法が見つからないため、現時点ではデータフレームを文字列として読み取ります
with open('df.csv','r',encoding='UTF-8') as f:
s = f.read() + '\n'
次に、str.replaceを使用して、このように1つずつ置き換えます。これは機能しますが、非効率的です。
s = str.replace(s, 'gap year', 'gap-year')
特定の用語のスペースを「-」に置き換える方法がある場合は、辞書を使用する必要はありません。
ありがとうございました
最初にリストを削除して辞書を変更し、次に部分文字列を置換Series.replace
しますregex=True
。
d = {'high school': 'high-school',
'spring break': 'spring-break',
'gap year': 'gap-year'}
df['Search term'] = df['Search term'].replace(d, regex=True)
print (df)
Search term Application
0 safe high-school trip 1
1 spring-break trips 2
2 gap-year trips 1
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加