文または長いテキストを含む列のラベルエンコーディング-keras

無限ループ

長いテキストまたは短いテキストで複数の列をエンコードする方法を探していましたが、実際には良い解決策を見つけることができませんでした。これが私のデータセットの例です:

IP         Country  Domain          Attack           Signature          Thread
0.0.0.0.0  US       somedomain.net  compromized site 8787tgd9347343dex  yes
1.1.1.1.1  US       otherdomain.net trojan           74384399rfg99737h1 yes

これまでのところ私は試してみましたLabelEncoderOneHotEncoderからsklearn、彼らは動作しませんでした。フィードバック、ヘルプ、または指示は大歓迎です。

編集


私が達成しようとしていることについてもっと詳しく説明しようと思いました

import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder, StandardScaler

df = pd.read_csv("export.csv", sep=",")

labelencoder = LabelEncoder()

def encoder(x = len(df.columns)):
    for i in range(x):
        df.iloc[:, i] = labelencoder.fit_transform(df.iloc[:, i])

encoder()

今、私は以下のデータフレームを持っています:

スクリーンショットスパイダー

ただし、これはこれを行う正しい方法のようには見えません。

ありがとう

ジシン

あなたはDictVectorizerから使用することができますsklearn.feature_extraction

import pandas as pd
from sklearn.feature_extraction import DictVectorizer

data=pd.read_csv('export.csv',encoding = "utf-8", header=0)
vectorizer = DictVectorizer(sparse=False)
X = vectorizer.fit_transform(data[data.columns[0:]].to_dict("records"))

print(X)

次の入力の場合:

          IP Country           Domain            Attack           Signature Thread
0  0.0.0.0.0      US   somedomain.net  compromized site   8787tgd9347343dex    yes
1  1.1.1.1.1      US  otherdomain.net            trojan  74384399rfg99737h1    yes

出力は次のようになります。

[[0. 1. 1. 0. 1. 1. 0. 0. 1. 1.]
 [1. 0. 0. 1. 1. 0. 1. 1. 0. 1.]] 

すべての列がトレーニング機能であると仮定すると、最後の列「スレッド」がラベルである場合は、コードを変更する必要があります。

ln=(len(data.columns)-1)
vectorizer = DictVectorizer(sparse=False)
X = vectorizer.fit_transform(data[data.columns[0:ln]].to_dict("records"))
Y = data[data.columns[ln]]

これがお役に立てば幸いです

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

1つを使用してモデルを作成します-Kerasのホットエンコーディング

分類Dev

Keras文字レベルのLSTMテキスト分類はトレーニングではありません

分類Dev

Keras:imagenetで事前にトレーニングされたモデルのラベル名を取得します

分類Dev

Keras:ワンホットエンコーディングのクラスの重み(class_weight)

分類Dev

Kerasのステートフルオートエンコーダ

分類Dev

Kerasモデルをトレーニングしようとしたときに「リソースが使い果たされました」メモリエラー

分類Dev

パディングなしでKerasのシーケンス長を変更

分類Dev

Kerasでカスタムステップアクティベーション関数を使用すると、「操作にはグラデーションの「なし」があります」という結果になります。エラー。これを解決する方法は?

分類Dev

Kerasモデルをトレーニングするためにnumpy配列でデータラベルを構成する方法は?

分類Dev

sklearnパイプラインを使用してKerasオートエンコーダモデルのターゲット値をスケーリングする方法

分類Dev

sklearnパイプラインを使用してKerasオートエンコーダモデルのターゲット値をスケーリングする方法

分類Dev

Kerasを使用した一連の文のトレーニング

分類Dev

kerasの事前トレーニング済みモデルは新しい入力プレースホルダーをフィードします

分類Dev

ファイル名とラベルを含むデータフレームを使用して、クラスラベル付きの画像を単一のディレクトリからKerasモデルにロードするにはどうすればよいですか?

分類Dev

KerasへのTensorflow:Kerasモデルでのグラフ定義エラーのインポート

分類Dev

KerasでBi-LSTM + CRFを使用した段落/文埋め込みレベルでのシーケンスラベリング

分類Dev

予測テンソルを最も近い整数に丸めようとしたときのKerasコスト関数エラー

分類Dev

kerasとpad_sequencesを使用してRのテキストシーケンスをパディングする方法は?

分類Dev

Kerasのコンテキストでのランクは何ですか?

分類Dev

'ランタイムが終了しました。自動的に再起動します。」大量のデータを含むKerasモデルを実行する場合

分類Dev

Kerasのデフォルトのアクティベーション機能

分類Dev

Keras-テキスト分析用のオートエンコーダ

分類Dev

KerasはGPUを使用しません-トラブルシューティングする方法?

分類Dev

Ubuntu14.04でディープラーニングのためにkerasを実行する際のエラー

分類Dev

Kerasマルチクラスセマンティックセグメンテーションラベル

分類Dev

Keras: 私のモデルは、指定されたラベルなしでトレーニングします。どのように可能ですか?

分類Dev

基本的な低レベルのTensorFlowトレーニングループを使用したtf.kerasモデルのトレーニングが機能しない

分類Dev

パーティがロードしたデータでKerasモデルをトレーニングする

分類Dev

TPUトレーニングKerasモデルの場合のみ形状エラー

Related 関連記事

  1. 1

    1つを使用してモデルを作成します-Kerasのホットエンコーディング

  2. 2

    Keras文字レベルのLSTMテキスト分類はトレーニングではありません

  3. 3

    Keras:imagenetで事前にトレーニングされたモデルのラベル名を取得します

  4. 4

    Keras:ワンホットエンコーディングのクラスの重み(class_weight)

  5. 5

    Kerasのステートフルオートエンコーダ

  6. 6

    Kerasモデルをトレーニングしようとしたときに「リソースが使い果たされました」メモリエラー

  7. 7

    パディングなしでKerasのシーケンス長を変更

  8. 8

    Kerasでカスタムステップアクティベーション関数を使用すると、「操作にはグラデーションの「なし」があります」という結果になります。エラー。これを解決する方法は?

  9. 9

    Kerasモデルをトレーニングするためにnumpy配列でデータラベルを構成する方法は?

  10. 10

    sklearnパイプラインを使用してKerasオートエンコーダモデルのターゲット値をスケーリングする方法

  11. 11

    sklearnパイプラインを使用してKerasオートエンコーダモデルのターゲット値をスケーリングする方法

  12. 12

    Kerasを使用した一連の文のトレーニング

  13. 13

    kerasの事前トレーニング済みモデルは新しい入力プレースホルダーをフィードします

  14. 14

    ファイル名とラベルを含むデータフレームを使用して、クラスラベル付きの画像を単一のディレクトリからKerasモデルにロードするにはどうすればよいですか?

  15. 15

    KerasへのTensorflow:Kerasモデルでのグラフ定義エラーのインポート

  16. 16

    KerasでBi-LSTM + CRFを使用した段落/文埋め込みレベルでのシーケンスラベリング

  17. 17

    予測テンソルを最も近い整数に丸めようとしたときのKerasコスト関数エラー

  18. 18

    kerasとpad_sequencesを使用してRのテキストシーケンスをパディングする方法は?

  19. 19

    Kerasのコンテキストでのランクは何ですか?

  20. 20

    'ランタイムが終了しました。自動的に再起動します。」大量のデータを含むKerasモデルを実行する場合

  21. 21

    Kerasのデフォルトのアクティベーション機能

  22. 22

    Keras-テキスト分析用のオートエンコーダ

  23. 23

    KerasはGPUを使用しません-トラブルシューティングする方法?

  24. 24

    Ubuntu14.04でディープラーニングのためにkerasを実行する際のエラー

  25. 25

    Kerasマルチクラスセマンティックセグメンテーションラベル

  26. 26

    Keras: 私のモデルは、指定されたラベルなしでトレーニングします。どのように可能ですか?

  27. 27

    基本的な低レベルのTensorFlowトレーニングループを使用したtf.kerasモデルのトレーニングが機能しない

  28. 28

    パーティがロードしたデータでKerasモデルをトレーニングする

  29. 29

    TPUトレーニングKerasモデルの場合のみ形状エラー

ホットタグ

アーカイブ