세 개의 CSV를 추가합니다.
df = pd.read_csv("places_1.csv")
temp = pd.read_csv("places_2.csv")
df = df.append(temp)
temp = pd.read_csv("places_3.csv")
df = df.append(temp)
print(df.head(20))
조인 된 테이블은 다음과 같습니다.
location device_count population
0 A 11 NaN
1 B 12 NaN
2 C 13 NaN
3 D 14 NaN
4 E 15 NaN
0 F 21 NaN
1 G 22 NaN
2 H 23 NaN
3 I 24 NaN
4 J 25 NaN
0 K 31 NaN
1 L 32 NaN
2 M 33 NaN
3 N 34 NaN
4 O 35 NaN
보시다시피 인덱스는 고유하지 않습니다.
이 iloc 함수를 호출하여 모집단 열에 2를 곱합니다.
df2 = df.copy
for index, row in df.iterrows():
df.iloc[index, df.columns.get_loc('population')] = row['device_count'] * 2
다음과 같은 잘못된 결과가 나타납니다.
location device_count population
0 A 11 62.0
1 B 12 64.0
2 C 13 66.0
3 D 14 68.0
4 E 15 70.0
0 F 21 NaN
1 G 22 NaN
2 H 23 NaN
3 I 24 NaN
4 J 25 NaN
0 K 31 NaN
1 L 32 NaN
2 M 33 NaN
3 N 34 NaN
4 O 35 NaN
각 CSV에 대해 첫 번째 CSV의 색인을 덮어 씁니다. 새 정수 열을 만들고 df.set_index ()를 호출하려고 시도했습니다. 작동하지 않았습니다.
팁이 있습니까?
먼저, 사용 ignore_index
, 둘째, 사용하지 않는 append
, 사용 pd.concat([temp1, temp2, temp3], ignore_index=True)
.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다