セルの最初の文字の後にパンダのデータフレーム列を(2つに)分割する

バイオメイジ

問題

pandasデータフレームの列を2つの列に分割したいのですが、パーセンテージ列(以下を参照)では、各エントリは大文字のアルファベット文字で始まります。この文字の直後の「パーセンテージ」列を、 「アミノ酸」というラベルの付いた新しい列。

現在のコード:

import pandas as pd

df = pd.read_csv('foo.csv')

df['Amino Acid'], df['Percentage'] = zip(*df['Percentage'].map(lambda x: x.split('[^a-zA-Z]')))

df.to_csv('bar.csv',index=False)

入力データの例

+-----------------------------+-------+-----+-----------+---------------------------------------------------------------------------------------------+
|           Species           |  ID   | OGT |    DB     |                                         Percentage                                          |
+-----------------------------+-------+-----+-----------+---------------------------------------------------------------------------------------------+
| Halogeometricum borinquense | 60847 |  37 | ATCC/DSMZ | E is 8.333003365670164% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 |  37 | ATCC/DSMZ | R is 6.310991522830762% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 |  37 | ATCC/DSMZ | A is 10.22668778459711% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
+-----------------------------+-------+-----+-----------+---------------------------------------------------------------------------------------------+

必要な出力の例

+-----------------------------+-------+-----+-----------+------------+--------------------------------------------------------------------------------------------+
|           Species           |  ID   | OGT |    DB     | Amino Acid |                                         Percentage                                         |
+-----------------------------+-------+-----+-----------+------------+--------------------------------------------------------------------------------------------+
| Halogeometricum borinquense | 60847 |  37 | ATCC/DSMZ | E          |  is 8.333003365670164% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa |
| Halogeometricum borinquense | 60847 |  37 | ATCC/DSMZ | R          | is 6.310991522830762% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa  |
| Halogeometricum borinquense | 60847 |  37 | ATCC/DSMZ | A          | is 10.22668778459711% in ./archaea/GCF_000337855.1/GCF_000337855.1_ASM33785v1_protein.faa  |
+-----------------------------+-------+-----+-----------+------------+--------------------------------------------------------------------------------------------+
ジェズリール

split最初の空白を使用します。

df[['Amino Acid', 'Percentage']] = df['Percentage'].str.split(n=1, expand=True)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

パンダデータフレーム - 複数の列に分割する文字列

分類Dev

条件に基づいてパンダデータフレーム列の特殊文字の文字列を分割する

分類Dev

パンダ:データフレームの列を別々の行に分割する

分類Dev

区切り文字の複数の列をパンダデータフレームの行に分割する

分類Dev

列パンダによるGroupbyを使用した2つのデータフレームの分割

分類Dev

パンダのデータフレームに最初の2つの複製を保持する方法は?

分類Dev

パンダのデータフレーム文字列を個別の行に分割する

分類Dev

パンダはデータフレームを2つのデータフレームに分割します

分類Dev

他の2つのデータフレームのセルコンテンツに基づいてパンダデータフレームを作成する

分類Dev

いくつかの条件に基づいてパンダデータフレームを効率的に2つのデータフレームに分割する

分類Dev

文字列をコンマで分割し、パンダのデータフレームに挿入する方法

分類Dev

パンダのデータフレームでセルを複数の行に分割する

分類Dev

パンダデータフレームの最初のセルに値を設定する

分類Dev

パンダデータフレームの最初のセルに値を設定する

分類Dev

パンダのデータフレームで特定の名前の列を複数の列に分割する

分類Dev

列ごとに2つのグループの文字列値を比較するパンダデータフレーム

分類Dev

2つの列に基づいてパンダデータフレームをリサンプルする

分類Dev

Python:2つの列の間のパンダデータフレームに列を追加する方法は?

分類Dev

パンダ:ルールを使用して、データフレームの2つの列の文字列値を新しい列に結合します

分類Dev

パンダでデータフレーム列を2つの別の列に分割するにはどうすればよいですか?

分類Dev

文字列列の値に基づいてパンダのデータフレームを分割します

分類Dev

2つのパンダ列を1つのデータフレームに混合し、最初の列の最初の要素、2番目の列の2番目の要素などを使用するにはどうすればよいですか?

分類Dev

csvファイルを複数の列でパンダデータフレームに分割する

分類Dev

パンダ:特定の列の文字列値に基づいて、データフレームを個別のデータフレームに分割します

分類Dev

文字に基づいて、パンダのデータフレームの各セルを新しい行に分割する方法は?

分類Dev

パンダ:最初のデータフレームの情報を保持して、列の2つのデータフレームをマージする方法は?

分類Dev

1つのパンダデータフレームを別のデータフレームにマージし、最初のデータフレームに存在する値を2番目のデータフレームから削除します

分類Dev

2つのデータフレームの違いの間にパンダスタイルを適用する

分類Dev

パンダデータフレームの列に大文字を適用する

Related 関連記事

  1. 1

    パンダデータフレーム - 複数の列に分割する文字列

  2. 2

    条件に基づいてパンダデータフレーム列の特殊文字の文字列を分割する

  3. 3

    パンダ:データフレームの列を別々の行に分割する

  4. 4

    区切り文字の複数の列をパンダデータフレームの行に分割する

  5. 5

    列パンダによるGroupbyを使用した2つのデータフレームの分割

  6. 6

    パンダのデータフレームに最初の2つの複製を保持する方法は?

  7. 7

    パンダのデータフレーム文字列を個別の行に分割する

  8. 8

    パンダはデータフレームを2つのデータフレームに分割します

  9. 9

    他の2つのデータフレームのセルコンテンツに基づいてパンダデータフレームを作成する

  10. 10

    いくつかの条件に基づいてパンダデータフレームを効率的に2つのデータフレームに分割する

  11. 11

    文字列をコンマで分割し、パンダのデータフレームに挿入する方法

  12. 12

    パンダのデータフレームでセルを複数の行に分割する

  13. 13

    パンダデータフレームの最初のセルに値を設定する

  14. 14

    パンダデータフレームの最初のセルに値を設定する

  15. 15

    パンダのデータフレームで特定の名前の列を複数の列に分割する

  16. 16

    列ごとに2つのグループの文字列値を比較するパンダデータフレーム

  17. 17

    2つの列に基づいてパンダデータフレームをリサンプルする

  18. 18

    Python:2つの列の間のパンダデータフレームに列を追加する方法は?

  19. 19

    パンダ:ルールを使用して、データフレームの2つの列の文字列値を新しい列に結合します

  20. 20

    パンダでデータフレーム列を2つの別の列に分割するにはどうすればよいですか?

  21. 21

    文字列列の値に基づいてパンダのデータフレームを分割します

  22. 22

    2つのパンダ列を1つのデータフレームに混合し、最初の列の最初の要素、2番目の列の2番目の要素などを使用するにはどうすればよいですか?

  23. 23

    csvファイルを複数の列でパンダデータフレームに分割する

  24. 24

    パンダ:特定の列の文字列値に基づいて、データフレームを個別のデータフレームに分割します

  25. 25

    文字に基づいて、パンダのデータフレームの各セルを新しい行に分割する方法は?

  26. 26

    パンダ:最初のデータフレームの情報を保持して、列の2つのデータフレームをマージする方法は?

  27. 27

    1つのパンダデータフレームを別のデータフレームにマージし、最初のデータフレームに存在する値を2番目のデータフレームから削除します

  28. 28

    2つのデータフレームの違いの間にパンダスタイルを適用する

  29. 29

    パンダデータフレームの列に大文字を適用する

ホットタグ

アーカイブ