다양한 양의 공백과 쉼표로 열이 구분되는 팬더를 사용하여 CSV 파일 읽기

user308827

csv 파일을 pandas 데이터 프레임으로 읽고 싶습니다. CSV 파일 : https://www.dropbox.com/s/o3xc74f8v4winaj/aaaa.csv?dl=0

특히,

  1. 첫 번째 행을 건너 뛰고 싶습니다

  2. 열 머리글은 2 행에 있습니다.이 경우 1, 1, 2 및 TOT입니다. 그래도 하드 코딩하고 싶지 않습니다. 추출되는 열이 TOT 뿐이면 괜찮습니다.

  3. 가능하면 팬더가 아닌 접근 방식을 사용하고 싶지 않습니다.

내가하는 일은 다음과 같습니다.

df = pandas.read_csv('https://www.dropbox.com/s/o3xc74f8v4winaj/aaaa.csv?dl=0', skiprows=1, skipinitialspace=True, sep=' ')

그러나 이것은 오류를 제공합니다.

*** CParserError: Error tokenizing data. C error: Expected 5 fields in line 4, saw 6

출력은 다음과 같아야합니다.

                    1       1       2     TOT
0   DEPTH(m)        0.01    1.24    1.52    
1   BD  33kpa(t/m3) 1.6     1.6     1.6
2   SAND(%)         42.1    42.1    65.1    
3   SILT(%)         37.9    37.9    16.9    
4   CLAY(%)         20      20      18  
5   ROCK(%)         12      12      12  
6   WLS(kg/ha)      0       5       0.1    5.1
7   WLM(kg/ha)      0       5       0.1    5.1
8   WLSL(kg/ha)     0       4       0.1    4.1
9   WLSC(kg/ha)     0       2.1     0      2.1
10  WLMC(kg/ha)     0       2.1     0      2.1
11  WLSLC(kg/ha)    0       1.7     0      1.7
12  WLSLNC(kg/ha)   0       0.4     0      0.4
13  WBMC(kg/ha)     9       1102.1  250.9   1361.9
14  WHSC(kg/ha)     69      8432    1920    10420
15  WHPC(kg/ha)     146     18018   4102    22266
16  WOC(kg/ha)      224     27556   6272    34
17  WLSN(kg/ha)     0       0       0       0
18  WLMN(kg/ha)     0       0.2     0       0.2
19  WBMN(kg/ha)     0.9     110.2   25.1    136.2
20  WHSN(kg/ha)     7       843     192     1042
21  WHPN(kg/ha)     15      1802    410     2227
22  WON(kg/ha)      22      2755    627     3405
23  CFEM(kg/ha)     0           
맥시 무

구분 기호로 사용할 정규식을 지정할 수 있습니다. 귀하의 경우에는 [\s,]{2,20}2 개 이상의 공백 또는 쉼표 와 함께 작동 합니다.

In [180]: pd.read_csv('aaaa.csv', 
                      skiprows = 1, 
                      sep='[\s,]{2,20}',
                      index_col=0)
Out[180]:
         Unnamed: 1       1       1.1        2      TOT
0
1          DEPTH(m)    0.01      1.24     1.52      NaN
2    BD 33kpa(t/m3)    1.60      1.60     1.60      NaN
3           SAND(%)   42.10     42.10    65.10      NaN
4           SILT(%)   37.90     37.90    16.90      NaN
5           CLAY(%)   20.00     20.00    18.00      NaN
6           ROCK(%)   12.00     12.00    12.00      NaN
7        WLS(kg/ha)    0.00      5.00     0.10      5.1
8        WLM(kg/ha)    0.00      5.00     0.10      5.1
9       WLSL(kg/ha)    0.00      4.00     0.10      4.1
10      WLSC(kg/ha)    0.00      2.10     0.00      2.1
11      WLMC(kg/ha)    0.00      2.10     0.00      2.1
12     WLSLC(kg/ha)    0.00      1.70     0.00      1.7
13    WLSLNC(kg/ha)    0.00      0.40     0.00      0.4
14      WBMC(kg/ha)    9.00   1102.10   250.90   1361.9
15      WHSC(kg/ha)   69.00   8432.00  1920.00  10420.0
16      WHPC(kg/ha)  146.00  18018.00  4102.00  22266.0
17       WOC(kg/ha)  224.00  27556.00  6272.00     34.0
18      WLSN(kg/ha)    0.00      0.00     0.00      0.0
19      WLMN(kg/ha)    0.00      0.20     0.00      0.2
20      WBMN(kg/ha)    0.90    110.20    25.10    136.2
21      WHSN(kg/ha)    7.00    843.00   192.00   1042.0
22      WHPN(kg/ha)   15.00   1802.00   410.00   2227.0
23       WON(kg/ha)   22.00   2755.00   627.00   3405.0
24      CFEM(kg/ha)    0.00       NaN      NaN      NaN
25,            None     NaN       NaN      NaN      NaN
26,            None     NaN       NaN      NaN      NaN

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

다양한 양의 공백과 쉼표로 열이 구분되는 팬더를 사용하여 CSV 파일 읽기

분류에서Dev

백분율이 X %이고 다양한 NA 문자가있는 R을 사용하여 CSV 파일 읽기

분류에서Dev

다양한 수의 공백을 구분 기호로 사용하여 텍스트 파일에서 테이블 읽기

분류에서Dev

따옴표로 묶인 값과 소수점으로 쉼표를 사용하여 CSV (쉼표로 구분 된 파일) 읽기

분류에서Dev

파이썬은 쉼표가있는 CSV를 구분 기호로 읽지 만 따옴표 안의 쉼표를 수천으로 해석합니다.

분류에서Dev

파운드 기호 뒤의 숫자를 캡처하는 정규식-쉼표가있는 양과 공백이 캡처되지 않은 뒤

분류에서Dev

구분 기호로 쉼표를 사용하여 CSV 파일을 postgres로 가져 오려고합니다.

분류에서Dev

쉼표를 구분 기호로 사용하여 CSV 파일에서 정규식을 사용하여 데이터 열의 위치를 변경하는 방법은 무엇입니까?

분류에서Dev

닫기 열에 문제가있는 팬더를 사용하여 CSV 파일에서 읽기

분류에서Dev

팬더를 사용하여 CSV 파일의 데이터를 행으로 전송하는 방법

분류에서Dev

txt를 CSV로 변환하기위한 배치 파일은 공백을 제거하고 쉼표를 열로 변환합니다.

분류에서Dev

데이터가 공백으로 구분되는 하나의 열 csv 파일에서 데이터 세트 생성

분류에서Dev

다양한 양의 공백으로 파이썬에서 정규식을 사용하는 방법

분류에서Dev

팬더 열에서 쉼표로 구분 된 문자열에서 중복 단어를 찾아 다양한 접두사를 추가합니다.

분류에서Dev

파일 폴더를 다양한 이름의 폴더로 이동하는 방법

분류에서Dev

bash를 사용하여 csv 파일의 세 번째 쉼표를 Linux의 공백으로 바꾸는 방법은 무엇입니까?

분류에서Dev

특정 패턴과 일치하지만 연속 된 모든 경우에 대해 문자열 일치의 일부를 추출하고 팬더를 사용하여 쉼표로 구분하는 방법

분류에서Dev

공백의 양이 같지 않은 텍스트 파일을 다시 포맷 한 다음 csv로 변환하는보다 효율적인 방법

분류에서Dev

쉼표와 공백 구분 기호가 모두있는 CSV 파일을 공백 구분 기호 만있는 CSV로 변환하는 방법

분류에서Dev

CSV의 다른 열에 if else 조건이있는 팬더를 사용하여 CSV 파일의 Nan 값 업데이트

분류에서Dev

구분자로 공백이 사용되는 .csv 파일 PHP에서 데이터를 바꾸는 방법

분류에서Dev

PHP를 사용하여 다운로드 가능한 CSV 파일을 만드는 방법 (쉼표로 분리 된 것 이외)

분류에서Dev

동일한 셀의 숫자를 두 개의 "쉼표로 구분 된 값 csv"파일로 나누기

분류에서Dev

R 내부에서 셸 또는 파이프를 사용하여 CSV 파일의 열 읽기-Windows

분류에서Dev

genfromtxt ()를 사용하여 NumPy의 텍스트 파일에서 다양한 길이의 열을 읽는 방법은 무엇입니까?

분류에서Dev

팬더를 사용하여 길이를 기준으로 문자열의 문자 사이에 공백을 삽입하는 방법이 있습니까?

분류에서Dev

한 파일의 CSV 헤더 이름을 사용하여 다른 헤더 이름으로 새 파일 만들기

분류에서Dev

Python : 다양한 폴더 (각 폴더에 하나의 .csv 파일이 있음)에서 동일한 .csv 파일을 단일 폴더로 복사합니다.

분류에서Dev

HDFS를 사용하여 다양한 크기의 파일 저장

Related 관련 기사

  1. 1

    다양한 양의 공백과 쉼표로 열이 구분되는 팬더를 사용하여 CSV 파일 읽기

  2. 2

    백분율이 X %이고 다양한 NA 문자가있는 R을 사용하여 CSV 파일 읽기

  3. 3

    다양한 수의 공백을 구분 기호로 사용하여 텍스트 파일에서 테이블 읽기

  4. 4

    따옴표로 묶인 값과 소수점으로 쉼표를 사용하여 CSV (쉼표로 구분 된 파일) 읽기

  5. 5

    파이썬은 쉼표가있는 CSV를 구분 기호로 읽지 만 따옴표 안의 쉼표를 수천으로 해석합니다.

  6. 6

    파운드 기호 뒤의 숫자를 캡처하는 정규식-쉼표가있는 양과 공백이 캡처되지 않은 뒤

  7. 7

    구분 기호로 쉼표를 사용하여 CSV 파일을 postgres로 가져 오려고합니다.

  8. 8

    쉼표를 구분 기호로 사용하여 CSV 파일에서 정규식을 사용하여 데이터 열의 위치를 변경하는 방법은 무엇입니까?

  9. 9

    닫기 열에 문제가있는 팬더를 사용하여 CSV 파일에서 읽기

  10. 10

    팬더를 사용하여 CSV 파일의 데이터를 행으로 전송하는 방법

  11. 11

    txt를 CSV로 변환하기위한 배치 파일은 공백을 제거하고 쉼표를 열로 변환합니다.

  12. 12

    데이터가 공백으로 구분되는 하나의 열 csv 파일에서 데이터 세트 생성

  13. 13

    다양한 양의 공백으로 파이썬에서 정규식을 사용하는 방법

  14. 14

    팬더 열에서 쉼표로 구분 된 문자열에서 중복 단어를 찾아 다양한 접두사를 추가합니다.

  15. 15

    파일 폴더를 다양한 이름의 폴더로 이동하는 방법

  16. 16

    bash를 사용하여 csv 파일의 세 번째 쉼표를 Linux의 공백으로 바꾸는 방법은 무엇입니까?

  17. 17

    특정 패턴과 일치하지만 연속 된 모든 경우에 대해 문자열 일치의 일부를 추출하고 팬더를 사용하여 쉼표로 구분하는 방법

  18. 18

    공백의 양이 같지 않은 텍스트 파일을 다시 포맷 한 다음 csv로 변환하는보다 효율적인 방법

  19. 19

    쉼표와 공백 구분 기호가 모두있는 CSV 파일을 공백 구분 기호 만있는 CSV로 변환하는 방법

  20. 20

    CSV의 다른 열에 if else 조건이있는 팬더를 사용하여 CSV 파일의 Nan 값 업데이트

  21. 21

    구분자로 공백이 사용되는 .csv 파일 PHP에서 데이터를 바꾸는 방법

  22. 22

    PHP를 사용하여 다운로드 가능한 CSV 파일을 만드는 방법 (쉼표로 분리 된 것 이외)

  23. 23

    동일한 셀의 숫자를 두 개의 "쉼표로 구분 된 값 csv"파일로 나누기

  24. 24

    R 내부에서 셸 또는 파이프를 사용하여 CSV 파일의 열 읽기-Windows

  25. 25

    genfromtxt ()를 사용하여 NumPy의 텍스트 파일에서 다양한 길이의 열을 읽는 방법은 무엇입니까?

  26. 26

    팬더를 사용하여 길이를 기준으로 문자열의 문자 사이에 공백을 삽입하는 방법이 있습니까?

  27. 27

    한 파일의 CSV 헤더 이름을 사용하여 다른 헤더 이름으로 새 파일 만들기

  28. 28

    Python : 다양한 폴더 (각 폴더에 하나의 .csv 파일이 있음)에서 동일한 .csv 파일을 단일 폴더로 복사합니다.

  29. 29

    HDFS를 사용하여 다양한 크기의 파일 저장

뜨겁다태그

보관