皆さんこんにちは
だから、私はこのテーブルを持っています(これは元のデータセットのサブセットにすぎません):
Customer Country
IT - Rome - Bank Of America Italy
DE - Berlin - BNP ParisBas Germany
IT - Rome - BNP ParisBas Italy
FR - Paris - CreditAgricole France
そして、私が欲しいのは、IT-ローマで始まるすべての文字列を文字列IT-ローマ-ソシエテジェネラルに置き換えることです
したがって、私の出力は次のようになります。
Customer Country
IT - Rome - societe generale Italy
DE - Berlin - BNP ParisBas Germany
IT - Rome - societe generale Italy
FR - Paris - CreditAgricole France
それを達成する方法についての助けは大歓迎です、ありがとう
like
Pysparkでの演算子の使用:
from pyspark.sql import functions as F
from pyspark.sql.functions import col
df.withColumn("Customer", F.when(col('Customer').like('IT - Rome%')\
, 'IT - Rome - societe generale').otherwise(col('Customer'))).show()
+----------------------------+-------+
|Customer |Country|
+----------------------------+-------+
|IT - Rome - societe generale|Italy |
|DE - Berlin - BNP ParisBas |Germany|
|IT - Rome - societe generale|Italy |
|FR - Paris - CreditAgricole |France |
+----------------------------+-------+
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加