検索

検索

機能から1つのホットエンコーディングディメンションへのマッピングを取得します

debugcn 投稿 Dev

1

フラズマン

だから、現在私は次のように1つのホットエンコーディングに変換している文字列カテゴリ機能の束を持っています

from sklearn.preprocessing import LabelEncoder, OneHotEncoder

X_str = np.array([['a', 'dog', 'red'], ['b', 'cat', 'green']])
# transform to integer
X_int = LabelEncoder().fit_transform(X_str.ravel()).reshape(*X_str.shape)
# transform to binary
X_bin = OneHotEncoder().fit_transform(X_int).toarray()

print(X_bin)
# [[ 1.  0.  0.  1.  0.  1.]
#  [ 0.  1.  1.  0.  1.  0.]]

これは機能します。

しかし、ディメンションがアクティブ化されているフィーチャからのマッピングを見つけようとしています

したがって、たとえば、「a」は0にマップされます（特徴ベクトルの0番目のインデックスが1に設定されているため）

'b'は1にマップされます（特徴ベクトルの最初のインデックスが1に設定されているため）

'cat'は2にマップされます（特徴ベクトルの2番目のインデックスが1に設定されているため）

したがって、これらすべてのマッピングを辞書で取得したいと思います。これらを達成するための良い方法は何ですか。

Vivek Kumar

を使用しLabelEncoder().classes_ます。それがアレンジされる順番になります。そしておそらくそれはアルファベットです。

つまり、LabelEncoder()オブジェクトを保存する必要があります。次のように使用します。

le = LabelEncoder()
X_int = le.fit_transform(X_str.ravel()).reshape(*X_str.shape)

print(le.classes_)
#Out:- ['a' 'b' 'cat' 'dog' 'green' 'red']

その後、次を使用できます。

labels = le.classes_

mappings = {}
for index, label in zip(range(len(labels)), labels):
    mappings[label]=index

print(mappings)
#Out: {'a': 0, 'b': 1, 'dog': 3, 'cat': 2, 'green': 4, 'red': 5}

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-5

0

コメントを追加

0

サインイン

関連記事

分類Dev

1つのホットエンコーディング機能

分類Dev

dict値から1つのホットエンコーディングを生成します

分類Dev

パンダはブール値として列から1つのホットエンコーディングを取得します

分類Dev

ワンホットエンコーディングへのセグメンテーション

分類Dev

パンダの辞書の列から1つのホットエンコーディングを作成する

分類Dev

numpyからの1つのホットエンコーディング

分類Dev

1つを使用してモデルを作成します-Kerasのホットエンコーディング

分類Dev

Verilogの1つのホットエンコーディング

分類Dev

ファイルからデータセットに1つのホットエンコーディングを抽出します

分類Dev

1つのホットエンコーディングを使用したラベルのリストのマッピング

分類Dev

numpyを使用した1つのホットエンコーディング

分類Dev

1つのホットエンコーディング文字

分類Dev

MLのホットエンコーディングを1つ保存してロードします

分類Dev

1つの列を1つのホットエンコーディング

分類Dev

1つのホットエンコーディングが機械学習のパフォーマンスを向上させるのはなぜですか？

分類Dev

ワンホットエンコーディングからのTensorflowマスク

分類Dev

Mybatisの1対多のコレクションマッピングには、常に1つのデフォルトエンティティがあります。

分類Dev

Pythonの列で1つのホットエンコーディングを実行せずに行間のジャッカード距離を取得します

分類Dev

文のホットエンコーディングを1つ取得する方法は？

分類Dev

参照IDへのディクショナリマッピング値を取得します

分類Dev

ゆっくりと変化するディメンションを処理するための機能データエンジニアリングアプローチの「ディメンションスナップショット」とは何ですか？

分類Dev

pyspark-1つのホットエンコーディング後に取得されたスパースベクトルを列に変換します

分類Dev

文字列を分割し、1つのホットエンコーディングでdfをロングフォーマットからワイドフォーマットに変換する

分類Dev

文字列を分割し、1つのホットエンコーディングでdfをロングフォーマットからワイドフォーマットに変換する

分類Dev

CFSMの状態の1つのホットエンコーディング

分類Dev

ScalaのRDDでの1つのホットエンコーディング

分類Dev

WFFM保存アクションはエディターからフィールドマッピングを取得します

分類Dev

ディスプレイスメントマップへの入力としてSVGグラデーションを使用する方法はありますか？

分類Dev

PythonとScikitを使用して線形回帰を行うには、1つのホットエンコーディングを使用して学習しますか？

Related 関連記事

記事

ホットタグ

アーカイブ