条件に基づいてパンダデータフレーム列の特殊文字の文字列を分割する

debugcn 投稿 Dev

コナー・リービット

pandasデータフレームのアドレス列で適合性を確立しようとしています。2つの形式のZipCode列があります：1）87301 2）87301-1234。すべての行にハイフンがあるわけではないので、ハイフンが存在する場合は分割する必要があります。

私のデータは次のようになります。

State  ZIP
CA     85145-7045
PA     76913

私はこの問題に取り組むいくつかの方法を試しました。私が試してみました：

data['Zip_1'],data['Zip_2'] = data['Zip'].str.split('-').str

私が試してみました：

data['Zip'] = data['Zip'].str.split('-', n=1, expand=True)
data['Zip'] = data['Zip'][0]
data['Zip_drop'] = data['Zip'][1]

また、ラムダ関数を使用してみました。

ただし、nullを返すだけです。

新しい列は、ハイフンが含まれていない郵便番号と、ハイフンが含まれている場合はハイフンの後の数字に対してNaNを返すと予想されます。ただし、新しい列はすべての観測に対してNaNを入力するだけです

ニコスパパス

これは、「replace」を正規表現と組み合わせて使用することで実行できます。

ステップ1

example_df = pd.DataFrame({'State': ['CA', 'PA'],
                           'ZIP': ['85145-7045', '76913'] })

example_df

ステップ2

# Keep only the numbers before the hyphen (if any).
example_df = example_df.replace('\-\d*', '', regex=True)
example_df

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-11

コメントを追加

サインイン

分類Dev

文字列列の値に基づいてパンダのデータフレームを分割します

分類Dev

パンダ：特定の列の文字列値に基づいて、データフレームを個別のデータフレームに分割します

分類Dev

パターンに基づいてデータフレームの行を新しい列に文字列分割

分類Dev

文字列のリストに基づいてパンダデータフレームから値を抽出する

分類Dev

条件パンダに基づいてデータフレームをフィルタリングする（文字列分割）

分類Dev

列の値の違いに基づいてパンダのデータフレームを分割する方法

分類Dev

他の列の条件に基づいてパンダのデータフレーム列を操作する方法

分類Dev

条件パンダデータフレーム列に基づいて文字列を削除します

分類Dev

特殊文字も含む部分的な文字列値に基づいてデータフレームをフィルタリングする

分類Dev

パンダ：列のnull値に基づいてデータフレームを分割する

分類Dev

ドットに基づいてパンダデータフレームの列を分割する

分類Dev

パンダ-データフレームの複数の条件に基づいて列を操作する

分類Dev

行の条件に基づいてパンダのデータフレームから列を選択する

分類Dev

パンダの特定の部分文字列またはパターンに基づいて文字列を分割する

分類Dev

条件を含む文字列に基づいてデータフレームの新しい列を作成する方法

分類Dev

文字列に基づいてデータフレームを分割する

分類Dev

セル文字列に基づいてデータフレームを分割する

分類Dev

リストに文字列が含まれている名前に基づいて、パンダのデータフレーム列を選択します

分類Dev

リストに文字列が含まれている名前に基づいて、パンダのデータフレーム列を選択します

分類Dev

条件に基づいてパンダのデータフレームに文字列分割メソッドを適用するにはどうすればよいですか？

分類Dev

文字の値に基づいてデータフレーム文字を列に分割します

分類Dev

部分的な文字列の一致に基づいてパンダを使用してPythonでデータフレームをフィルタリングする

分類Dev

null列に基づいてパンダデータフレームを複数のデータフレームに分割する

分類Dev

文字列のリストに基づいてパンダのデータフレームをフィルタリングする

分類Dev

マルチ条件ロジックに基づいて、個別のパンダデータフレームから文字列を返します

分類Dev

列内の文字列に基づいてデータフレームをフィルタリングする

分類Dev

パンダのインデックスのリストに基づいて、文字列のデータフレームを複数の列に分割するにはどうすればよいですか？

分類Dev

集計せずに一意の文字列値に基づいてパンダデータフレームを複数のデータフレームに分割する方法

分類Dev

条件に基づいてパンダデータフレームの列の数を検索します

Related 関連記事

記事