正規表現の一致に基づいてデータフレーム内の文字列値を置き換えます

debugcn 投稿 Dev

ルイス・ラモン・ラミレス・ロドリゲス

「accredited」という列のあるpythonデータフレームがあります。この列には、「10/10/2011」という認定のデータが含まれている必要があります。または「Notaccredited」と入力します。ただし、認定されていない場合、ほとんどの場合、列にはいくつかのデータがあります。「このビジネスは認定されていません.....」のようなテキストテキスト全体を置き換えて、「認定されていません」と入力します。

今、私は関数を書きました：

def notAcredited(string):
    if ('Not' in string or 'not' in string):
        return  'Not Accredited'

ループで関数を実装していますが、「。apply」メソッドでこれを行うことは可能ですか？

for i in range(len(df_1000_1500)):
    accreditacion = notAcredited(df_1000_1500['BBBAccreditation'][i])
    if accreditacion == 'Not Accredited':
        df_1000_1500['BBBAccreditation'][i] = accreditacion

忘れてください

ベクトル化された文字列メソッドを使用できますSeries.str.replace：

In [72]: df = pd.DataFrame({'accredited': ['10/10/2011', 'is not accredited']})

In [73]: df
Out[73]: 
          accredited
0         10/10/2011
1  is not accredited

In [74]: df['accredited'] = df['accredited'].str.replace(r'(?i).*not.*', 'not accredited')

In [75]: df
Out[75]: 
       accredited
0      10/10/2011
1  not accredited

replaceたとえばr'(?i).*not.*'、に渡される最初の引数は、任意の正規表現パターンにすることができます。2番目は、任意の正規表現置換値にすることができます。これは、で受け入れられるのと同じ種類の文字列re.subです。(?i)正規表現パターンでは、大文字と小文字を区別しないので、パターンになりnot、Not、NOt、NoT、など、すべての試合が希望を。

Series.str.replaceの呼び出しをCythonizeしますre.sub（これにより、Pythonループを使用するためapply、apply使用して達成できる速度よりも高速になります）。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-29

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

正規表現の一致に基づいてデータフレーム内の文字列値を置き換えます

正規表現の一致に基づいてデータフレーム内の文字列値を置き換えます

正規表現は、パターンに基づいてすべての一致を置き換えます

別のデータフレームの一致するIDに基づいてデータフレーム列の値を置き換えます

正規表現に基づいてデータフレーム列を置き換えます

Python-別のデータフレームの一致に基づいてデータフレームの値を置き換えます

文字列の一部が一致したときに辞書に基づいてデータフレーム全体の値を置き換える方法は？

文字列の一部が一致したときに辞書に基づいてデータフレーム全体の値を置き換える方法は？

文字列内の正規表現パターンを、一致に応じて置換文字列に置き換えます

2番目のデータフレーム列の一致に基づいてデータフレーム列の値を置き換える

別のデータフレームの日付と一致する値に基づいて、値をNanに置き換えます

正規表現を使用して取得した一致に基づいて、別の列の列の値を置き換えます（Python Pandas）

複数の名前付き正規表現の一致に基づいて文字列の内容を置き換えます

データフレーム内の特定の文字列に一致する値を置き換える

pandasデータフレームで正規表現を使用して列の値を置き換えます

列名と変数の一致に基づいてデータフレームのセル値を置き換えます

データフレーム内の位置に基づいて文字列を数値に置き換える方法は？

正規表現の一致後に部分データを取得して、元の文字列に置き換えます

部分一致に基づいてデータフレーム内の値を置換

R別のデータフレーム内の一致する名前に基づいて列名を置き換える

R別のデータフレーム内の一致する名前に基づいて列名を置き換える

特定の関数を適用して、データフレーム内の別の列の基準に基づいて列の値を置き換えます

データフレーム列（正規表現）の値を置き換える

正規表現の一致を値の配列に置き換えます

正規表現パターンに一致する文字列の先頭にあるすべての文字を置き換えます

文字列内の一致する正規表現値を辞書の正しい値に置き換えます

欠落しているデータを、別のデータフレーム内の一致する行の値に置き換えます

条件に基づいてデータフレーム列の値を置き換えます

pandasデータフレームに基づいてnumpy2D配列の値を置き換えます

文字列内のN番目の正規表現一致オカレンスを置き換えます

R正規表現は、データフレーム内の「\」と改行を一致させて、新しい値を持つ列を作成します