Pandas DataFrame에서 LabelEncoder 인코딩 열을 디코딩하는 방법은 무엇입니까?

사마르 프라 탑 싱

나는 데이터 세트를 가지고 있습니다. 다음 코드 줄을 사용하여 범주 형 개체를 숫자로 변환하여 기능 공학을 연습하고있었습니다.

import pandas as pd 
import numpy as np
from sklearn import preprocessing
df = pd.read_csv(r'train.csv',index_col='Id')
print(df.shape)
df.head()
colsNum = df.select_dtypes(np.number).columns
colsObj = df.columns.difference(colsNum)

df[colsNum] = df[colsNum].fillna(df[colsNum].mean()//1)
df[colsObj] = df[colsObj].fillna(df[colsObj].mode().iloc[0])

label_encoder = preprocessing.LabelEncoder() 
for col in colsObj:
    df[col] = label_encoder.fit_transform(df[col])
df.head()
for col in colsObj:
    df[col] = label_encoder.inverse_transform(df[col])
df.head()

그러나 여기서는 inverse_tranform()원래 데이터 세트를 반환하지 않았습니다. 제발 도와주세요!

이스 르엘

올바른 작업을 위해서는 LabelEncoder사전 데이터 유형으로 변환 해야합니다.

from sklearn import preprocessing
df = pd.read_csv(r'train.csv',index_col='Id')

print(df.shape)
print (df.head())
    MSSubClass MSZoning  LotFrontage  LotArea Street Alley LotShape  \
Id                                                                    
1           60       RL         65.0     8450   Pave   NaN      Reg   
2           20       RL         80.0     9600   Pave   NaN      Reg   
3           60       RL         68.0    11250   Pave   NaN      IR1   
4           70       RL         60.0     9550   Pave   NaN      IR1   
5           60       RL         84.0    14260   Pave   NaN      IR1   

   LandContour Utilities LotConfig  ... PoolArea PoolQC Fence MiscFeature  \
Id                                  ...                                     
1          Lvl    AllPub    Inside  ...        0    NaN   NaN         NaN   
2          Lvl    AllPub       FR2  ...        0    NaN   NaN         NaN   
3          Lvl    AllPub    Inside  ...        0    NaN   NaN         NaN   
4          Lvl    AllPub    Corner  ...        0    NaN   NaN         NaN   
5          Lvl    AllPub       FR2  ...        0    NaN   NaN         NaN   

   MiscVal MoSold  YrSold  SaleType  SaleCondition  SalePrice  
Id                                                             
1        0      2    2008        WD         Normal     208500  
2        0      5    2007        WD         Normal     181500  
3        0      9    2008        WD         Normal     223500  
4        0      2    2006        WD        Abnorml     140000  
5        0     12    2008        WD         Normal     250000  

[5 rows x 80 columns]

colsNum = df.select_dtypes(np.number).columns
colsObj = df.columns.difference(colsNum)

df[colsNum] = df[colsNum].fillna(df[colsNum].mean()//1)
df[colsObj] = df[colsObj].fillna(df[colsObj].mode().iloc[0])

from collections import defaultdict
di = defaultdict(preprocessing.LabelEncoder)

for col in colsObj:
    df[col] = di[col].fit_transform(df[col])

print (df.head())
    MSSubClass  MSZoning  LotFrontage  LotArea  Street  Alley  LotShape  \
Id                                                                        
1           60         3         65.0     8450       1      0         3   
2           20         3         80.0     9600       1      0         3   
3           60         3         68.0    11250       1      0         0   
4           70         3         60.0     9550       1      0         0   
5           60         3         84.0    14260       1      0         0   

    LandContour  Utilities  LotConfig  ...  PoolArea  PoolQC  Fence  \
Id                                     ...                            
1             3          0          4  ...         0       2      2   
2             3          0          2  ...         0       2      2   
3             3          0          4  ...         0       2      2   
4             3          0          0  ...         0       2      2   
5             3          0          2  ...         0       2      2   

    MiscFeature  MiscVal  MoSold  YrSold  SaleType  SaleCondition  SalePrice  
Id                                                                            
1             2        0       2    2008         8              4     208500  
2             2        0       5    2007         8              4     181500  
3             2        0       9    2008         8              4     223500  
4             2        0       2    2006         8              0     140000  
5             2        0      12    2008         8              4     250000  

[5 rows x 80 columns]

print (di)
defaultdict(<class 'sklearn.preprocessing._label.LabelEncoder'>, {'Alley': LabelEncoder(), 'BldgType': LabelEncoder(), 'BsmtCond': LabelEncoder(), 'BsmtExposure': LabelEncoder(), 'BsmtFinType1': LabelEncoder(), 'BsmtFinType2': LabelEncoder(), 'BsmtQual': LabelEncoder(), 'CentralAir': LabelEncoder(), 'Condition1': LabelEncoder(), 'Condition2': LabelEncoder(), 'Electrical': LabelEncoder(), 'ExterCond': LabelEncoder(), 'ExterQual': LabelEncoder(), 'Exterior1st': LabelEncoder(), 'Exterior2nd': LabelEncoder(), 'Fence': LabelEncoder(), 'FireplaceQu': LabelEncoder(), 'Foundation': LabelEncoder(), 'Functional': LabelEncoder(), 'GarageCond': LabelEncoder(), 'GarageFinish': LabelEncoder(), 'GarageQual': LabelEncoder(), 'GarageType': LabelEncoder(), 'Heating': LabelEncoder(), 'HeatingQC': LabelEncoder(), 'HouseStyle': LabelEncoder(), 'KitchenQual': LabelEncoder(), 'LandContour': LabelEncoder(), 'LandSlope': LabelEncoder(), 'LotConfig': LabelEncoder(), 'LotShape': LabelEncoder(), 'MSZoning': LabelEncoder(), 'MasVnrType': LabelEncoder(), 'MiscFeature': LabelEncoder(), 'Neighborhood': LabelEncoder(), 'PavedDrive': LabelEncoder(), 'PoolQC': LabelEncoder(), 'RoofMatl': LabelEncoder(), 'RoofStyle': LabelEncoder(), 'SaleCondition': LabelEncoder(), 'SaleType': LabelEncoder(), 'Street': LabelEncoder(), 'Utilities': LabelEncoder()})

for col in colsObj:
    df[col] = di[col].inverse_transform(df[col])

print (df.head())
    MSSubClass MSZoning  LotFrontage  LotArea Street Alley LotShape  \
Id                                                                    
1           60       RL         65.0     8450   Pave  Grvl      Reg   
2           20       RL         80.0     9600   Pave  Grvl      Reg   
3           60       RL         68.0    11250   Pave  Grvl      IR1   
4           70       RL         60.0     9550   Pave  Grvl      IR1   
5           60       RL         84.0    14260   Pave  Grvl      IR1   

   LandContour Utilities LotConfig  ... PoolArea PoolQC  Fence MiscFeature  \
Id                                  ...                                      
1          Lvl    AllPub    Inside  ...        0     Gd  MnPrv        Shed   
2          Lvl    AllPub       FR2  ...        0     Gd  MnPrv        Shed   
3          Lvl    AllPub    Inside  ...        0     Gd  MnPrv        Shed   
4          Lvl    AllPub    Corner  ...        0     Gd  MnPrv        Shed   
5          Lvl    AllPub       FR2  ...        0     Gd  MnPrv        Shed   

   MiscVal MoSold  YrSold  SaleType  SaleCondition  SalePrice  
Id                                                             
1        0      2    2008        WD         Normal     208500  
2        0      5    2007        WD         Normal     181500  
3        0      9    2008        WD         Normal     223500  
4        0      2    2006        WD        Abnorml     140000  
5        0     12    2008        WD         Normal     250000  

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Eclipse에서 문자열을 인코딩하는 방법은 무엇입니까?

분류에서Dev

인코딩 된 값을 디코딩하는 방법은 무엇입니까?

분류에서Dev

인코딩 된 값을 디코딩하는 방법은 무엇입니까?

분류에서Dev

Android Aplication에서 JSON 값을 디코딩하는 방법은 무엇입니까?

분류에서Dev

Dart에서 URL을 인코딩하는 방법은 무엇입니까?

분류에서Dev

PySpark에서 DateTime 값을 인코딩하는 방법은 무엇입니까?

분류에서Dev

Julia에서 MIME 인코딩을 설정하는 방법은 무엇입니까?

분류에서Dev

Python에서 인코딩을 변환하는 방법은 무엇입니까?

분류에서Dev

Pandas의 레이블 인코딩에서 하나 또는 두 개의 열을 제외하는 방법은 무엇입니까?

분류에서Dev

PHP / JavaScript : 문자열을 가장 잘 인코딩 / 디코딩하는 방법은 무엇입니까?

분류에서Dev

나중에 공유 환경 설정에 저장하기 위해 객체 목록을 인코딩하고 디코딩하는 방법은 무엇입니까?

분류에서Dev

파이썬에서 경로를 인코딩하고 디코딩하는 방법은 무엇입니까?

분류에서Dev

shell_exec ()에서 반환 된 UTF-8 문자열을 디코딩하는 방법은 무엇입니까?

분류에서Dev

Swift에서 카테고리 배열을 디코딩하는 올바른 방법은 무엇입니까?

분류에서Dev

XSLT에서 base64 문자열을 HTML 콘텐츠로 디코딩하는 방법은 무엇입니까?

분류에서Dev

C에서 변수 문자열을 디코딩하는 방법은 무엇입니까?

분류에서Dev

PHP에서 JSON 디코딩 배열을 표시하는 방법은 무엇입니까?

분류에서Dev

Android에서 PHP 패스의 JSON 문자열을 디코딩하는 방법은 무엇입니까?

분류에서Dev

Haskell에서 재귀 JSON 배열을 디코딩하는 방법은 무엇입니까?

분류에서Dev

PHP에서 Base64 문자열을 텍스트로 디코딩하는 방법은 무엇입니까?

분류에서Dev

웹 리소스를 저장하고 URL 인코딩 문자에 디코딩을 적용하는 방법은 무엇입니까?

분류에서Dev

Flutter 또는 Dart에서 문자열을 RFC 3986로 인코딩하는 방법은 무엇입니까?

분류에서Dev

첫 번째 항목을 가져 와서 json 문자열을 디코딩하는 방법은 무엇입니까?

분류에서Dev

파이썬에서 텍스트 문자열을 숫자로 인코딩하는 방법은 무엇입니까?

분류에서Dev

urlopen 내부에서 문자열을 올바르게 인코딩하는 방법은 무엇입니까?

분류에서Dev

자바 스크립트에서 PHP JSON 인코딩 배열을 반복하는 방법은 무엇입니까?

분류에서Dev

페이지 소스 코드에서 사전으로 json을 디코딩하는 방법은 무엇입니까?

분류에서Dev

이 파일을 Python으로 인코딩 / 디코딩하는 방법은 무엇입니까?

분류에서Dev

JPG 파일을 int 시퀀스로 인코딩 / 디코딩하는 방법은 무엇입니까?

Related 관련 기사

  1. 1

    Eclipse에서 문자열을 인코딩하는 방법은 무엇입니까?

  2. 2

    인코딩 된 값을 디코딩하는 방법은 무엇입니까?

  3. 3

    인코딩 된 값을 디코딩하는 방법은 무엇입니까?

  4. 4

    Android Aplication에서 JSON 값을 디코딩하는 방법은 무엇입니까?

  5. 5

    Dart에서 URL을 인코딩하는 방법은 무엇입니까?

  6. 6

    PySpark에서 DateTime 값을 인코딩하는 방법은 무엇입니까?

  7. 7

    Julia에서 MIME 인코딩을 설정하는 방법은 무엇입니까?

  8. 8

    Python에서 인코딩을 변환하는 방법은 무엇입니까?

  9. 9

    Pandas의 레이블 인코딩에서 하나 또는 두 개의 열을 제외하는 방법은 무엇입니까?

  10. 10

    PHP / JavaScript : 문자열을 가장 잘 인코딩 / 디코딩하는 방법은 무엇입니까?

  11. 11

    나중에 공유 환경 설정에 저장하기 위해 객체 목록을 인코딩하고 디코딩하는 방법은 무엇입니까?

  12. 12

    파이썬에서 경로를 인코딩하고 디코딩하는 방법은 무엇입니까?

  13. 13

    shell_exec ()에서 반환 된 UTF-8 문자열을 디코딩하는 방법은 무엇입니까?

  14. 14

    Swift에서 카테고리 배열을 디코딩하는 올바른 방법은 무엇입니까?

  15. 15

    XSLT에서 base64 문자열을 HTML 콘텐츠로 디코딩하는 방법은 무엇입니까?

  16. 16

    C에서 변수 문자열을 디코딩하는 방법은 무엇입니까?

  17. 17

    PHP에서 JSON 디코딩 배열을 표시하는 방법은 무엇입니까?

  18. 18

    Android에서 PHP 패스의 JSON 문자열을 디코딩하는 방법은 무엇입니까?

  19. 19

    Haskell에서 재귀 JSON 배열을 디코딩하는 방법은 무엇입니까?

  20. 20

    PHP에서 Base64 문자열을 텍스트로 디코딩하는 방법은 무엇입니까?

  21. 21

    웹 리소스를 저장하고 URL 인코딩 문자에 디코딩을 적용하는 방법은 무엇입니까?

  22. 22

    Flutter 또는 Dart에서 문자열을 RFC 3986로 인코딩하는 방법은 무엇입니까?

  23. 23

    첫 번째 항목을 가져 와서 json 문자열을 디코딩하는 방법은 무엇입니까?

  24. 24

    파이썬에서 텍스트 문자열을 숫자로 인코딩하는 방법은 무엇입니까?

  25. 25

    urlopen 내부에서 문자열을 올바르게 인코딩하는 방법은 무엇입니까?

  26. 26

    자바 스크립트에서 PHP JSON 인코딩 배열을 반복하는 방법은 무엇입니까?

  27. 27

    페이지 소스 코드에서 사전으로 json을 디코딩하는 방법은 무엇입니까?

  28. 28

    이 파일을 Python으로 인코딩 / 디코딩하는 방법은 무엇입니까?

  29. 29

    JPG 파일을 int 시퀀스로 인코딩 / 디코딩하는 방법은 무엇입니까?

뜨겁다태그

보관