Pandas의 데이터에 대한 연속 누락 된 연도 월 생성

debugcn 에 게시 Dev

팔리 하 지크 라

다음은 각 개인에 대해 그 달에 기여한 금전적 기여를 제공하는 데이터입니다.

    df.head()

    | year_mo | name  | contribution|
    | 202001  | Fey   |  30         |
    | 202003  | Fey   |  20         |
    | 202004  | Fey   |  10         |
    | 202001  | Jay   |  30         |
    | 202003  | Jay   |  20         |

나는 202001-202006에서 각 사람에 대해 연속적인 연도를 생성하고 싶습니다. 그 사람이 기여하지 않으면 다음과 같이 0이됩니다.

    | year_mo | name  | contribution|
    | 202001  | Fey   |  30         |
    | 202002  | Fey   |   0         |
    | 202003  | Fey   |  20         |
    | 202004  | Fey   |  10         |
    | 202005  | Fey   |   0         |
    | 202006  | Fey   |   0         |
    | 202001  | Jay   |  30         |
    | 202002  | Jay   |   0         |
    | 202003  | Jay   |  20         |
    | 202004  | Jay   |   0         |
    | 202005  | Jay   |   0         |
    | 202006  | Jay   |   0         |

연속 연도 월 df와 함께 외부 조인을 시도한 곳에서이를 수행하기 위해 다음을 시도했지만 원하는 출력을 얻지 못했습니다.

   years = list(range(2020,2021,1))
   months= list(range(1,7,1))
   rows_list = []


   for yr in years:
     for mn in months:
     dict1 = {}
     dict1 = {'key' :1, 'year_mo' : (yr*100)+mn}
     rows_list.append(dict1)
   yearmo_df = pd.DataFrame(rows_list)
 
   df['key'] = 1

 
   new_df = pd.merge(left=df, right=yearmo_df, left_on='year_mo' ,right_on='year_mo', how='outer')

귀하의 안내 또는 제안에 미리 감사드립니다.

꽝황

우리는 사용할 수 있습니다 MultiIndex및 reindex:

new_idx = pd.MultiIndex.from_product([np.arange(202001,202007), df['name'].unique()],
                                     names=['year_mo','name'])

(df.set_index(['year_mo', 'name'])
   .reindex(new_idx, fill_value=0)
   .sort_index(level=['name','year_mo'])
   .reset_index()
)

또 다른 optino pivot_table뒤에 re_index, 및 stack:

(df.pivot_table(index='year_mo', columns='name', fill_value=0)
   .reindex(np.arange(202001,202007), fill_value=0)
   .stack()
   .reset_index()
)

산출:

    year_mo name  contribution
0    202001  Fey            30
1    202002  Fey             0
2    202003  Fey            20
3    202004  Fey            10
4    202005  Fey             0
5    202006  Fey             0
6    202001  Jay            30
7    202002  Jay             0
8    202003  Jay            20
9    202004  Jay             0
10   202005  Jay             0
11   202006  Jay             0

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-5

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

Pandas의 데이터에 대한 연속 누락 된 연도 월 생성

Pandas의 데이터에 대한 연속 누락 된 연도 월 생성

양방향 데이터 바인딩에 대한 DatePicker 일, 월 및 연도 속성이 누락 되었습니까?

연도와 월별로 그룹화 된 데이터에서 누락 된 월에 대한 행 만들기 (다중 인덱스)

Pandas 데이터 프레임에서 누락 된 연도 및 분기에 대한 행을 만드는 방법

월 및 연도 값이 누락 된 선택 추가

Excel : 누락 된 연도 범위를 하나의 셀로 생성

누락 된 연도를 데이터 프레임에 추가 (재 형성)

Pandas, Python, 데이터 누락 연도 열

데이터베이스의 날짜 연속성 (누락 된 날짜 간격 찾기)

Pandas 데이터 프레임에서 누락 된 연도 / 분기의 열을 0으로 채 웁니다.

Ruby on Rails-연결의 결과로 누락 된 속성 오류

데이터의 다음 연도에 대한 누적 주 번호

Pandas에서 누락 된 연도 별 행 추가

Python Pandas : 연속 누락 된 주중 날짜를 반환하고 데이터 프레임에서 누락 된 날짜 옆에 요금을 할당합니다.

2022 년 1 월 1 일에 대한 잘못된 연도

strptime 시간 변환-연도와 월에 대한 잘못된 값

Pandas-연도가 누락 된 상태에서 Churn이 발생하는지 확인

자바 스크립트 : 배열을 연속적으로 만드는 데 필요한 누락 된 숫자의 수에 대한 숫자 배열 확인

월, 일, 연도에서 NSDate 생성

Odoo의 XML 속성에 대한 도메인 필터 연산자

zoo-package에서 as.yearmon ()을 사용하여 df를 연도와 월별로 정렬하는 누락 된 달

연속 데이터에서 파생 된 이산 데이터에 대한 키 값 관찰

Python Azure 함수에 대한 누락 된 종속성

누락 된 변수에 대한 카운터 생성

월 및 연도에 대한 SQL 쿼리

Pandas의 연속 데이터에 대한 Countplot

PHP 및 SQL, 사용자 정의 블로그에 대한 중첩 된 연도, 월 및 게시물 수 쿼리

일, 주, 월 및 연도에 대한 MongoDB 그룹 집계 쿼리의 여러 누산기

Prometheus : 이진 연산에서 누락 된 레이블에 대한 값 병합

SQL Server의 모든 회계 연도 (4 월 -3 월)에 대한 회계 연도 명세서