Pandas 데이터 프레임이 정수를 부동 데이터 유형으로 변환하는 이유

debugcn 에 게시 Dev

니푼

csv 파일이 있습니다.

Wed Dec 04 11:30:04 GMT+05:30 2019,20,35.0,143455434,0
Wed Dec 04 11:30:13 GMT+05:30 2019,40,25.5,null,

이것을 pandas에로드하고 개별 열을 각 데이터 유형으로 변환하고 싶습니다. 이것이 내가하는 방법

raw_df = pd.read_csv('raw.csv', dtype=str)
raw_df = raw_df.replace({'null':None, pd.np.nan: None})

이것은 변환하는 내 기능입니다.

def df_function(row):
    row['timestamp'] = parse(row['timestamp'])
    row['odometer'] = float(row['odometer']) + 1
    row['speed'] = float(row['speed'])

    if row['id'] is not None:
        row['id'] = str(row['id'])

    if row['error_code'] is not None:
        row['error_code'] = int(row['error_code'])

    return row

raw_df = raw_df.apply(df_function, axis=1)

열의 데이터 유형을 인쇄하면

timestamp     datetime64[ns, tzoffset(None, -19800)]
odometer                                     float64
speed                                        float64
id                                            object
error_code                                   float64
dtype: object

error_code 는 float64이지만 int64 여야하지만 여기서 문제는 무엇입니까?

소시 오 패스

문서 에서 언급했듯이pandas

Integer NA 지원은 현재 전통적인 int8과 비교하여 Int8과 같이 대문자로 표시된 dtype 버전을 사용합니다. 이것은 나중에 변경 될 수 있습니다.

열을 다음으로 변경해야합니다. Int8

df = pd.DataFrame({"error_code":[1,2,5,np.nan]}) 
print(df.dtypes)

# error_code    float64
# dtype: object

df["error_code"] = df["error_code"].astype("Int8") 
print(df.dtypes)

산출:

error_code    Int8
dtype: object

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

Pandas 데이터 프레임이 정수를 부동 데이터 유형으로 변환하는 이유

Pandas 데이터 프레임이 정수를 부동 데이터 유형으로 변환하는 이유

행을 DateTime 데이터 유형 Pandas 데이터 프레임으로 변환

pandas : 이상한 사전 유형의 데이터를 데이터 프레임으로 변경

Pandas 데이터 프레임에서 값을 검색 할 때 정수를 문자열 유형으로 변환

JSON에서 Pandas 데이터 프레임 유형으로 변경

pandas 결과 NaN 값에서 객체 데이터 유형을 부동 데이터 유형으로 변환

Pandas 데이터 프레임에서 쉼표가있는 값을 부동 소수점으로 변환합니다.

Pandas groupby를 부울 값이있는 열이있는 데이터 프레임으로 변환

python pandas-정수를 열 이름으로 사용하여 데이터 프레임 부분 설정

Pandas : 튜플 인덱스를 사용하여 두 데이터 프레임에서 다른 데이터 프레임으로 데이터 이동

Pandas 데이터 프레임의 첫 번째 헤더를 동일한 ID를 유지하는 행으로 변환하는 방법

Pandas 데이터 프레임 열을 다른 열의 변수 값으로 이동

데이터 프레임 항목을 Python / Pandas에서 부동으로 변환

numpy ndarray 및 pandas 데이터 프레임이있는 mypy 오버로드 함수 (서명 매개 변수 유형이 동일하거나 더 넓음)

emty 목록`[]`를`[0]`Pandas 데이터 프레임으로 변환

Flightradar24 API를 Pandas 데이터 프레임으로 변환

ndarray를 Pandas 데이터 프레임으로 변환

Dictionay를 Pandas 데이터 프레임으로 변환

pandas : CSV 시리즈를 데이터 프레임으로 변환

기존 ID 번호를 유지하면서 Pandas 데이터 프레임을 새 데이터로 업데이트

목록 값이있는 Pandas 시리즈를 부울 데이터 프레임으로 변환

임시 변수로 Pandas 데이터 프레임의 값 정렬

SQL 필드 데이터 유형 varchar를 데이터가 이미 저장된 부동 소수점으로 변경

python 변수에서 pandas 데이터 프레임으로 데이터로드

파이썬 데이터 프레임은 정수를 부동 소수점으로 변환합니다.

서로 다른 두 데이터 프레임의 열을 동일한 데이터 유형으로 강제 변환

Pandas 데이터 프레임 열 값을 문자열에서 부동 소수점으로 변환

Pandas를 데이터 프레임으로 부분적으로 바꾸는 방법

일부 데이터 프레임 행을 Pandas의 열로 변환

Pandas 데이터 프레임 목록을 부울 열로 변환