read_csv에서 문자열 번호를 float로 변환 할 때 오류가 발생했습니다.

debugcn 에 게시 Dev

Nhaus

csv 파일 ( https://www.kaggle.com/mansoordaku/ckdisease/data의 kidney_disease.csv)을 읽는 동안 pandas는 실수로 pcv , wc 및 rc 열을 dtype 개체 (float이어야 함)에 할당합니다 . dtypes를 지정하면 오류가 발생합니다.

data = pd.read_csv(file, usecols=["pcv", "wc", "rc"], 
                   dtype={"pcv": np.float64, "wc": np.float64, "rc": np.float64})

ValueError: could not convert string to float: '\t?'

왜 이런 일이 발생하는지 설명해 줄 수 있습니까? 이 열의 모든 값은 숫자 또는 nan에 해당하는 문자열입니다. 그리고 팬더가 처음 100 개 행 또는 이와 비슷한 것을 기반으로 dtype을 "추측"할 가능성이 있습니까?

감사합니다!

scign

소스 데이터 파일이 깨끗하지 않습니다. 먼저 파일을 읽은 다음 float로 구문 분석해야합니다.

import pandas as pd

df = pd.read_csv('kidney_disease.csv')
cols = ['pcv','wc','rc']
df = df[cols]
for col in cols:
    df[col] = pd.to_numeric(df[col],downcast='float',errors='coerce')
print(df.dtypes)

산출

pcv    float32
wc     float32
rc     float32
dtype: object

이로 인해 nan문자열을 변환 할 수없는 값 이 생성됩니다 . 데이터 세트를 조사하여 다른 정리가 필요한지 확인해야합니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

read_csv에서 문자열 번호를 float로 변환 할 때 오류가 발생했습니다.

read_csv에서 문자열 번호를 float로 변환 할 때 오류가 발생했습니다.

열을 개체에서 부동으로 변환 할 때 값 오류가 발생했습니다.

문자열을 정수로 변환하려고 할 때 오류가 발생했습니다.

SQL Server 2012에서 날짜를 선택할 때 문자열에서 날짜를 변환하는 중 오류가 발생했습니다.

숫자보다 크거나 작은 것을 확인할 때 데이터 형식 nvarchar를 float로 변환하는 중 오류가 발생했습니다.

Integer.parseInt ()를 사용하여 문자열을 정수로 변환하려고 할 때 오류가 발생했습니다.

요소의 첫 번째 자식에서 .setAttribute ()를 호출 할 때 오류가 발생했습니다.

클래스 생성자에서 변수를 복사하려고 할 때 오류가 발생했습니다.

Android : JSON 응답에서 날짜를 변환 할 때 "지정된 개체를 날짜로 형식화 할 수 없습니다"오류가 발생했습니다.

R의 문자열에서 해시 태그를 추출 할 때 오류가 발생했습니다.

데이터 유형 varchar를 varbinary로 변환하는 중에 오류가 발생했습니다. 정수로 변환 할 때 MSSQL

PUT 요청에 대한 매개 변수를 구문 분석 할 때 오류가 발생했습니다.

테이블에 숫자를 추가 할 때 오류가 발생했습니다.

Sql Server "문자열에서 날짜 및 / 또는 시간을 변환 할 때 변환에 실패했습니다."에 데이터를 저장하는 동안이 오류가 발생합니다. 아래는 내 코드입니다.

ElasticSearch는 Logstash로 CSV를 가져올 때 문자열을 날짜로 변환 오류를 발생시킵니다.

코드에서 저장 프로 시저를 실행할 때 varchar를 datetime으로 변환하는 중 오류가 발생했습니다.

Swift에서 문자열에서 날짜로 변환하려고 할 때 왜 오류가 발생합니까?

TS로 변환 할 때 공급자로 루트 요소를 래핑하는 동안 오류가 발생했습니다.

"문자열에서 날짜 및 / 또는 시간을 변환 할 때 변환이 실패했습니다"라는 오류가 발생하는 SQL Server 트리거를 디버깅하려면 어떻게해야합니까?

xslt 스타일 시트 --xml에서 csv로 : 동적 결과 문서 (exist-db)에서 for-each 루프를 사용할 때 오류가 발생했습니다.

C #에서 문자열을 double로 변환 할 때 오류 발생

angularjs에서 월 번호를 월 이름으로 변환하는 중에 오류가 발생했습니다.

CSV에서 numpy 배열로 데이터를 변환 할 때 오류 발생

Angular-ui-router : 해결 속성에 번호를 할당 할 때 오류가 발생했습니다.

페르시아 문자를 Excel에서 SQL로 변환 할 때 오류 발생

R에서 문자를 날짜로 변환하려고 할 때 오류 발생

param으로 함수를 호출 할 때 오류가 발생했습니다.

다른 파일에서 유형 변수를 참조 할 때 오류가 발생했습니다.

파이썬에서 json 문자열을 결합 할 때 구문 오류가 발생했습니다.

저장 프로 시저에서 varchar를 숫자로 변환하는 동안 오류가 발생했습니다.