이와 같은 데이터 프레임이 있고 nan 값을 포함하는 favorite_food 열에 상당한 수의 범주 값 (약 100 개)이 있다고 가정합니다.
Name | favorite_food
Anna | apple
Barbara | banana
Charlie | apple
Danie | nan
Emily | nan
............
내 목표는 범주 값을 다음과 같이 숫자로 변환하는 것입니다.
Name | favorite_food
Anna | 1
Barbara | 2
Charlie | 1
Danie | 0
Emily | 0
............
그렇다면이 코드를 df.favorite_food =df.favorite_food.astype('category')
어떻게 수정해야 합니까? 아니면 다른 방법이 있습니까?
당 이 링크 누락 된 값에 대한 기본 할당은 -1
달성 할 수있는.cat.codes
값을에 df.favorite_food =df.favorite_food.cat.codes
매핑하는 주어진 경우에 사용할 수 있습니다 .np.nan
-1
특정 매핑을 정의하려는 경우 ( np.nan = 0
-언급했듯이) 사전을 사용하여 수행 할 수 있습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다