パンダデータフレームの文字列列を01ベクトルに変換します

林馬

LabelEncoderOneHotEncoderに文字列を変換するnumpyの配列、のためにかなり良い作品を0,1ベースとするベクター。

私の質問は、パンダのデータフレームの列を0, 1ベクトルに変換するための優れたAPIはありますか?私は私のコードとパンダのデータフレームの生の内容を示し123.csv、私はバイナリにしたいと仮定し0, 1た列のためにc_ac_bc_c私はバイナリにしたい、3列のそれぞれは独立しており0, 1、別々に独立したため。

コード、

import pandas as pd
sample=pd.read_csv('123.csv', sep=',',header=None)
print sample.dtypes

123.csvコンテンツ、

c_a,c_b,c_c,c_d
hello,python,pandas,1.2
hi,c++,vector,1.2

numpyのラベルエンコーダーとOneHotEncoderの例、

from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder

S = np.array(['b','a','c'])
le = LabelEncoder()
S = le.fit_transform(S)
print(S)
ohe = OneHotEncoder()
one_hot = ohe.fit_transform(S.reshape(-1,1)).toarray()
print(one_hot)
which results in:

[1 0 2]

[[ 0.  1.  0.]
 [ 1.  0.  0.]
 [ 0.  0.  1.]]

編集1、試してみましたがget_dummies、結果は0.01.0(のようですfloat)のようですが、整数に直接変換する方法はありますか?

   0_c_a  0_hello  0_hi  0_ho  1_c++  1_c_b  1_java  1_python  2_c_c  2_numpy  \
0    1.0      0.0   0.0   0.0    0.0    1.0     0.0       0.0    1.0      0.0   
1    0.0      1.0   0.0   0.0    0.0    0.0     0.0       1.0    0.0      0.0   
2    0.0      0.0   1.0   0.0    0.0    0.0     1.0       0.0    0.0      0.0   
3    0.0      0.0   0.0   1.0    1.0    0.0     0.0       0.0    0.0      1.0  
HYRY

お探しget_dummiesですか?

s = pd.Series(["a", "b", "a", "c"])
pd.get_dummies(s)

あなたが望むならints

pd.get_dummies(s).astype(np.uint8)

参照:

パンダget_dummiesは、floatではなくdtype integer / boolを出力します

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

データフレーム内の文字列をベクトルに変換し、データフレームをアンネストします

分類Dev

パンダ:データフレーム内のすべての列を文字列に変換します

分類Dev

文字列のパンダデータフレームをintのnumpy配列に変換します

分類Dev

パンダのデータフレームto_csv()は、デフォルトで文字列「1」を「1.0」に変換します

分類Dev

ns精度の文字列をパンダデータフレームの日時に変換します

分類Dev

パンダ:文字列タプルのリストをデータフレームにすばやく変換しますか?

分類Dev

パンダ:データフレーム列をdictに変換し、列のタイトルをdictキー、列の値をdict値とします

分類Dev

特定の文字列をパンダデータフレームに変換します

分類Dev

パンダの単一列データフレームをシリーズまたは派手なベクトルに変換する方法

分類Dev

パンダデータフレームは時間なしで文字列をデータに変換します

分類Dev

文字列をパンダデータフレームの条件に変換する

分類Dev

パンダはデータフレームをタプルの配列に変換します

分類Dev

パンダはデータフレームをタプルの配列に変換します

分類Dev

パンダデータフレームの「表にした」文字列をデータフレームに変換します

分類Dev

パンダデータフレームの変換-一部の行の値を列に変換します

分類Dev

パンダデータフレームの特定の列全体の合計をベクトル化します

分類Dev

レベルをrのデータフレーム列に変換します

分類Dev

データフレーム全体を1つの長い列(ベクトル)に変換します

分類Dev

複数のデータフレーム列を数値ベクトルに変換します

分類Dev

Pythonパンダのデータフレームの行または列をnumpy配列に変換します

分類Dev

Pythonパンダのデータフレームの行または列をnumpy配列に変換します

分類Dev

データフレーム内のベクトル列を配列列に変換し直す

分類Dev

リストのリストを文字列に変換するパンダデータフレーム

分類Dev

データフレーム内の辞書のリストを文字列のリストに変換します-パンダ

分類Dev

「バイト」オブジェクトをパンダデータフレーム、Python3.xのリテラル文字列に変換する方法は?

分類Dev

Pythonはラベル付きの文字列のリストでデータフレームを変換します

分類Dev

パンダシリーズのマルチインデックスをデータフレーム列に変換します

分類Dev

パンダのデータフレームを列をキーとしてjsonに変換します

分類Dev

文字列をパンダデータフレームに変換する

Related 関連記事

  1. 1

    データフレーム内の文字列をベクトルに変換し、データフレームをアンネストします

  2. 2

    パンダ:データフレーム内のすべての列を文字列に変換します

  3. 3

    文字列のパンダデータフレームをintのnumpy配列に変換します

  4. 4

    パンダのデータフレームto_csv()は、デフォルトで文字列「1」を「1.0」に変換します

  5. 5

    ns精度の文字列をパンダデータフレームの日時に変換します

  6. 6

    パンダ:文字列タプルのリストをデータフレームにすばやく変換しますか?

  7. 7

    パンダ:データフレーム列をdictに変換し、列のタイトルをdictキー、列の値をdict値とします

  8. 8

    特定の文字列をパンダデータフレームに変換します

  9. 9

    パンダの単一列データフレームをシリーズまたは派手なベクトルに変換する方法

  10. 10

    パンダデータフレームは時間なしで文字列をデータに変換します

  11. 11

    文字列をパンダデータフレームの条件に変換する

  12. 12

    パンダはデータフレームをタプルの配列に変換します

  13. 13

    パンダはデータフレームをタプルの配列に変換します

  14. 14

    パンダデータフレームの「表にした」文字列をデータフレームに変換します

  15. 15

    パンダデータフレームの変換-一部の行の値を列に変換します

  16. 16

    パンダデータフレームの特定の列全体の合計をベクトル化します

  17. 17

    レベルをrのデータフレーム列に変換します

  18. 18

    データフレーム全体を1つの長い列(ベクトル)に変換します

  19. 19

    複数のデータフレーム列を数値ベクトルに変換します

  20. 20

    Pythonパンダのデータフレームの行または列をnumpy配列に変換します

  21. 21

    Pythonパンダのデータフレームの行または列をnumpy配列に変換します

  22. 22

    データフレーム内のベクトル列を配列列に変換し直す

  23. 23

    リストのリストを文字列に変換するパンダデータフレーム

  24. 24

    データフレーム内の辞書のリストを文字列のリストに変換します-パンダ

  25. 25

    「バイト」オブジェクトをパンダデータフレーム、Python3.xのリテラル文字列に変換する方法は?

  26. 26

    Pythonはラベル付きの文字列のリストでデータフレームを変換します

  27. 27

    パンダシリーズのマルチインデックスをデータフレーム列に変換します

  28. 28

    パンダのデータフレームを列をキーとしてjsonに変換します

  29. 29

    文字列をパンダデータフレームに変換する

ホットタグ

アーカイブ