pandas DataFrame에서 inf를 반환하는 열의 mean () : 어떻게 해결할 수 있습니까?

debugcn 에 게시 Dev

아우 구스토 리 바스

기계 학습 알고리즘을 구현하려고하는데 데이터를 통합하는 데 어려움이 있습니다.

아래 예에서는 UCI에서 예제 데이터 세트를로드하고 누락 된 데이터가있는 행을 제거합니다 (이전 질문의 도움 덕분에). 이제 데이터를 정규화하려고합니다.

많은 데이터 세트에 대해 다음을 사용했습니다.

valores = (valores - valores.mean()) / (valores.std())

그러나이 특정 데이터 세트의 경우 위의 접근 방식이 작동하지 않습니다. 문제는 inf아마도 정밀도 문제로 인해 mean 함수가을 반환한다는 것입니다. 아래 예를 참조하십시오.

bcw = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data', header=None)

for col in bcw.columns:
    if bcw[col].dtype != 'int64':
        print "Removendo possivel '?' na coluna %s..." % col
        bcw = bcw[bcw[col] != '?']

valores = bcw.iloc[:,1:10]
#mean return inf
print  valores.iloc[:,5].mean()

제 질문은 이것을 어떻게 처리 하느냐입니다. 이 칼럼의 유형을 변경해야하는 것 같지만 어떻게해야할지 모르겠습니다.

데이브

pandas에 익숙하지 않지만 numpy 배열로 변환하면 작동합니다.

np.asarray(valores.iloc[:,5], dtype=np.float).mean()

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-3

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

pandas DataFrame에서 inf를 반환하는 열의 mean () : 어떻게 해결할 수 있습니까?

pandas DataFrame에서 inf를 반환하는 열의 mean () : 어떻게 해결할 수 있습니까?

Result <(), Error>를 반환하는 함수에서 Serde의 오류를 어떻게 반환 할 수 있습니까?

Android에서 함수의 결과를 어떻게 반환 할 수 있습니까?

pandas의 .prod 결과는 나에게 inf 번호를 제공합니다. 결과를 어떻게 볼 수 있습니까?

Pandas에서 열 간의 관계를 어떻게 구축 할 수 있습니까?

Mongodb에서 결과의 일부로 반환되는 arrayList를 어떻게 반복 할 수 있습니까?

함수 분포에 대해 mean 및 std dev를 반환하는 일반적인 파이썬 클래스 메서드를 어떻게 만들 수 있습니까?

anaconda에서 Mac에 Pandas 1.1.0을 설치하고 "환경 해결"에 매달려있는 conda를 어떻게 극복 할 수 있습니까?

Pandas-Dataframe에는 목록이있는 열이 있습니다. 목록 내의 요소를 어떻게 그룹화 할 수 있습니까?

두 함수에 의존하는 함수를 어떻게 반환 할 수 있습니까?

Promise를 반환하는 두 함수의 실행 순서를 어떻게 지정할 수 있습니까?

vuejs 또는 다른 솔루션에서이 배열 문제를 어떻게 해결할 수 있습니까?

Python에서 random.sample의 ValueError를 어떻게 해결할 수 있습니까?

Ruby에서 해시의 일부를 어떻게 반복 할 수 있습니까?

Pandas DataFrame에서 임의의 행 시퀀스를 어떻게 선택할 수 있습니까?

함수에서 fs.lstat 메서드의 결과를 어떻게 반환 할 수 있습니까?

Pandas 데이터 프레임의 열에서 실수 또는 정수의 수를 어떻게 계산할 수 있습니까?

SERIAL 유형의 열에 대해 Informix에서 일련 번호를 어떻게 순환 할 수 있습니까?

Pandas를 사용하여 Series를 DataFrame에 어떻게 연결할 수 있습니까?

Pandas DataFrame에서 TimeSeries로 어떻게 변환 할 수 있습니까?

2 개의 배열에 대해 하나의 함수를 어떻게 사용할 수 있습니까?

요일을 나타내고 해당 숫자를 반환하는 문자열 유형 확장을 어떻게 디자인 할 수 있습니까? Swift에서

Pandas df의 여러 열에서 가장 최근 날짜를 어떻게 선택할 수 있습니까?

루프의 각 항목 배열에 대한 약속을 반환하는 함수를 어떻게 호출 할 수 있습니까?

어떻게 하나의 jsonschema를 다른 jsonschema에 연결할 수 있습니까?

Targetpath의 오류를 어떻게 해결할 수 있습니까?

한 열의 값을 사용하여 다른 열의 nan을 채우고 Pandas에서는 그 반대로 어떻게 할 수 있습니까?

SPARQL 쿼리에서 반환 된 데이터 세트의 유니 코드 문제를 어떻게 해결할 수 있습니까?

List를 반환하는 메서드에서 예외를 throw하는 서비스를 어떻게 모의 할 수 있습니까?

다른 페이지에서 오는 두 개의 데이터를 어떻게 반환 할 수 있습니까?