Pandas, Python, 데이터 누락 연도 열

파이썬 상인

다음과 같은 데이터 프레임이 있습니다 ...

        Date      Time    Meridiem    Day
  80    01-05   9:35:00   AM      Tuesday
  81    01-05   9:40:00   AM      Tuesday
  82    01-05   9:45:00   AM      Tuesday
  83    01-05   9:50:00   AM      Tuesday
  84    01-05   9:55:00   AM      Tuesday
... ... ... ... ...
222020  11-30   3:50:00   PM      Monday
222021  11-30   3:55:00   PM      Monday
222022  11-30   4:00:00   PM      Monday
222023  11-30   4:05:00   PM      Monday
222024  11-30   4:10:00   PM      Monday

그러나 그들은 datetime 객체 아닙니다 ...

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 221945 entries, 80 to 222024
Data columns (total 4 columns):
 #   Column    Non-Null Count   Dtype 
---  ------    --------------   ----- 
 0   Date      221945 non-null  object
 1   Time      221945 non-null  object
 2   Meridiem  221945 non-null  object
 3   Day       221945 non-null  object
dtypes: object(4)

이 데이터 프레임의 '연도'열을 추가해야합니다. 데이터는 순서대로 정리되어 있으며 각 행은 2010-01-05부터 2020-11-30 (약 11 년)까지 오전 9시 35 분부터 오후 4시 15 분까지 (영업일 만) 5 분 간격입니다.

연도 열을 추가하는 가장 쉬운 방법은 무엇입니까? 나는 그해의 마지막 날의 행 인덱스를 수동으로 찾고 연도를 11 개 항목으로 추가 할 수 있다고 가정하지만 더 쉬운 방법이 있는지 알고 싶습니까?

데이비드 에릭슨

True행을 연도의 변경으로 식별 하고 누적 합계를 취할 수 있습니다.

  1. (df['Date'].str[0:2] == '01') 1 월을 식별하고 반환 True
  2. (df['Date'].str[0:2] != df['Date'].shift().str[0:2]))1 년에 1 True개만 반환하도록 매월 첫 번째 행을 반환 True하므로 cumsum()2009를 추가하고 2009를 추가하여 첫 해에 2009 + 1 = 2010, 두 번째 해에 2011 등을 얻을 수 있습니다.

df['Year'] = ((df['Date'].str[0:2] == '01') & 
              (df['Date'].str[0:2] != df['Date'].shift().str[0:2])).cumsum() + 2009
df
Out[1]: 
         Date     Time Meridiem      Day  Year
80      01-05  9:35:00       AM  Tuesday  2010
81      01-05  9:40:00       AM  Tuesday  2010
82      01-05  9:45:00       AM  Tuesday  2010
83      01-05  9:50:00       AM  Tuesday  2010
84      01-05  9:55:00       AM  Tuesday  2010
222020  11-30  3:50:00       PM   Monday  2010
222021  11-30  3:55:00       PM   Monday  2010
222022  11-30  4:00:00       PM   Monday  2010
222023  11-30  4:05:00       PM   Monday  2010
222024  11-30  4:10:00       PM   Monday  2010
80      01-05  9:35:00       AM  Tuesday  2011
81      01-05  9:40:00       AM  Tuesday  2011
82      01-05  9:45:00       AM  Tuesday  2011
83      01-05  9:50:00       AM  Tuesday  2011
84      01-05  9:55:00       AM  Tuesday  2011
222020  11-30  3:50:00       PM   Monday  2011
222021  11-30  3:55:00       PM   Monday  2011
222022  11-30  4:00:00       PM   Monday  2011
222023  11-30  4:05:00       PM   Monday  2011
222024  11-30  4:10:00       PM   Monday  2011

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Pandas 데이터 프레임에서 누락 된 연도 / 분기의 열을 0으로 채 웁니다.

분류에서Dev

Pandas의 데이터에 대한 연속 누락 된 연도 월 생성

분류에서Dev

시계열 데이터에서 누락 된 지점을 pandas.date_range 및 pandas.reindex python으로 채우기

분류에서Dev

Pandas : 값이 누락 된 경우에도 시계열 플로팅

분류에서Dev

Python Pandas : 누락 된 날짜에 대한 행 삽입, 그룹 별 데이터 프레임에 시계열

분류에서Dev

Python Pandas : 두 데이터 프레임의 누락 된 행을 추가하고 추가 열 유지

분류에서Dev

인덱스 증분 Python Pandas 데이터 프레임을 기반으로 누락 된 열 값 찾기 및 추가

분류에서Dev

Pandas DataFrame 열에서 누락 된 날짜 데이터 식별

분류에서Dev

Python Pandas : 연속 누락 된 주중 날짜를 반환하고 데이터 프레임에서 누락 된 날짜 옆에 요금을 할당합니다.

분류에서Dev

Pandas 데이터 프레임에서 누락 된 연도 및 분기에 대한 행을 만드는 방법

분류에서Dev

Pandas : 한 열에 누락 된 데이터가있는 행의 데이터 프레임 값 업데이트

분류에서Dev

Pandas-시계열 데이터에서 누락 된 시간 채우기

분류에서Dev

Pandas-누락 된 열을 데이터 프레임에 자동으로 추가

분류에서Dev

Pandas는 다른 행의 열에서 누락 된 데이터를 채 웁니다.

분류에서Dev

누락 된 데이터가있는 여러 파일에 대한 Python Pandas 쿼리

분류에서Dev

Pandas를 사용하여 열의 누락 된 값 업데이트

분류에서Dev

python pandas : 다른 열의 전월 말 데이터 참조 시도

분류에서Dev

Pandas에서 누락 된 열 연결 및 채우기

분류에서Dev

Python에서 panda 데이터 프레임에 누락 된 시계열 데이터 행을 추가하는 방법

분류에서Dev

Python Pandas : 시계열 내에서 누락 된 값 대체

분류에서Dev

matplotlibm에서 테이블로 플롯되었지만 첫 번째 열이 누락 된 pandas 데이터 프레임

분류에서Dev

열 값이 누락 된 경우 증분 값으로 Pandas 데이터 프레임으로 대체

분류에서Dev

pandas groupby 필터 결과에 누락 된 키 열

분류에서Dev

'Pandas'의 열별로 누락 / NaN 데이터의 요약 수를 얻으려면 어떻게해야합니까?

분류에서Dev

시계열 데이터 누락 시간 값 및 데이터 값

분류에서Dev

날짜가 누락되지 않도록 Pandas에서 누락 된 열을 전달하는 방법

분류에서Dev

하나의 누락 된 열이있는 두 데이터 프레임 연결 / 결합 / 병합

분류에서Dev

python : 다중 열 pandas 데이터 파일

분류에서Dev

Python, Pandas에서 데이터 재 배열

Related 관련 기사

  1. 1

    Pandas 데이터 프레임에서 누락 된 연도 / 분기의 열을 0으로 채 웁니다.

  2. 2

    Pandas의 데이터에 대한 연속 누락 된 연도 월 생성

  3. 3

    시계열 데이터에서 누락 된 지점을 pandas.date_range 및 pandas.reindex python으로 채우기

  4. 4

    Pandas : 값이 누락 된 경우에도 시계열 플로팅

  5. 5

    Python Pandas : 누락 된 날짜에 대한 행 삽입, 그룹 별 데이터 프레임에 시계열

  6. 6

    Python Pandas : 두 데이터 프레임의 누락 된 행을 추가하고 추가 열 유지

  7. 7

    인덱스 증분 Python Pandas 데이터 프레임을 기반으로 누락 된 열 값 찾기 및 추가

  8. 8

    Pandas DataFrame 열에서 누락 된 날짜 데이터 식별

  9. 9

    Python Pandas : 연속 누락 된 주중 날짜를 반환하고 데이터 프레임에서 누락 된 날짜 옆에 요금을 할당합니다.

  10. 10

    Pandas 데이터 프레임에서 누락 된 연도 및 분기에 대한 행을 만드는 방법

  11. 11

    Pandas : 한 열에 누락 된 데이터가있는 행의 데이터 프레임 값 업데이트

  12. 12

    Pandas-시계열 데이터에서 누락 된 시간 채우기

  13. 13

    Pandas-누락 된 열을 데이터 프레임에 자동으로 추가

  14. 14

    Pandas는 다른 행의 열에서 누락 된 데이터를 채 웁니다.

  15. 15

    누락 된 데이터가있는 여러 파일에 대한 Python Pandas 쿼리

  16. 16

    Pandas를 사용하여 열의 누락 된 값 업데이트

  17. 17

    python pandas : 다른 열의 전월 말 데이터 참조 시도

  18. 18

    Pandas에서 누락 된 열 연결 및 채우기

  19. 19

    Python에서 panda 데이터 프레임에 누락 된 시계열 데이터 행을 추가하는 방법

  20. 20

    Python Pandas : 시계열 내에서 누락 된 값 대체

  21. 21

    matplotlibm에서 테이블로 플롯되었지만 첫 번째 열이 누락 된 pandas 데이터 프레임

  22. 22

    열 값이 누락 된 경우 증분 값으로 Pandas 데이터 프레임으로 대체

  23. 23

    pandas groupby 필터 결과에 누락 된 키 열

  24. 24

    'Pandas'의 열별로 누락 / NaN 데이터의 요약 수를 얻으려면 어떻게해야합니까?

  25. 25

    시계열 데이터 누락 시간 값 및 데이터 값

  26. 26

    날짜가 누락되지 않도록 Pandas에서 누락 된 열을 전달하는 방법

  27. 27

    하나의 누락 된 열이있는 두 데이터 프레임 연결 / 결합 / 병합

  28. 28

    python : 다중 열 pandas 데이터 파일

  29. 29

    Python, Pandas에서 데이터 재 배열

뜨겁다태그

보관