{simpleDF.columns
#output :['color', 'lab', 'value1', 'value2']
indexer = simpleDF.select('lab')
from pyspark.ml.feature import StringIndexer
# Let us create an object of the class StringIndexer
lblindexer=StringIndexer().setInputCol(indexer).setOutputCol("LabelIndexed")
idxRes=lblindexer.fit(simpleDF).transform(simpleDF)
idxRes.show(5)}
이 코드 줄에서 잘 작동하지만 더 일반적으로 원합니다.
#lblindexer=StringIndexer().setInputCol('lab').setOutputCol("LabelIndexed")
오류 발생 : TypeError : 매개 변수 "inputCol"에 대해 잘못된 매개 변수 값이 지정되었습니다. <class 'pyspark.sql.dataframe.DataFrame'>을 문자열 유형으로 변환 할 수 없습니다.
데이터 프레임이 아닌 입력 열에 열 이름을 사용하십시오.
lblindexer=StringIndexer().setInputCol('lab').setOutputCol("LabelIndexed")
변수를 사용하려면
indexer = 'lab'
lblindexer=StringIndexer().setInputCol(indexer).setOutputCol("LabelIndexed")
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다