학습 및 테스트 샘플을 빌드 할 수 있도록 2 개의 데이터 프레임의 열을 하나의 데이터 프레임으로 결합하려고합니다. 이 링크 Towards Data Science 에서 연습을 사용하고 있지만 다른 Excel 스프레드 시트를 사용하고 있습니다.
지금까지 두 데이터 프레임의 열을 결합 할 때까지 모든 코드가 작동했습니다. 아래 코드는 지금까지 내가 가지고있는 것의 축소 버전이지만, 내가 빠뜨린 모든 코드는 데이터를 탐색하는 것 뿐이라고 생각합니다. 즉, 저는 Python 여정에 익숙하지 않아서 얼마나 많은 코드가 도움이 될지 모르겠습니다. 필요한 경우 더 많이 게시 할 수 있습니다.
마지막 줄을 제외한 모든 코드가 작동합니다.이 오류는 다음과 같습니다. Unable to coerce to Series, length must be 16 : given 14
어떤 아이디어?
import numpy as np
import pandas as pd
healthcare = pd.read_csv('/medical_clean.csv')
cols_cat_num = ['ReAdmis', 'Initial_admin', 'HighBlood', 'Stroke', 'Complication_risk', 'Overweight', 'Arthritis', 'Diabetes', 'BackPain', 'Anxiety', 'Allergic_rhinitis', 'Reflux_esophagitis', 'Asthma']
healthcare[cols_cat_num] = healthcare[cols_cat_num].astype('str')
healthcare_cat=pd.get_dummies(healthcare[cols_cat_num + ['HighBlood']], drop_first = True)
healthcare_num=['Population', 'VitD_levels', 'Income', 'Doc_visits', 'Full_meals_eaten', 'vitD_supp', 'Item1', 'Item2', 'Item3', 'Item4', 'Item5', 'Item6', 'Item7', 'Item8']
healthcare[healthcare_num]= healthcare[healthcare_num].astype('str')
finalhealth= healthcare_num + healthcare_cat
healthcare_cat
는 팬더 DataFrame이고 healthcare_num
목록입니다. 오류 메시지는 파이썬이 "강제"를 시도했지만이 두 개의 매우 다른 객체를 사용하여 추가를 수행 할 수 없기 때문에 발생합니다.
pd.concat()
DataFrame을 결합 하기 위해 탐색 할 수 있습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다