Pandas 데이터 프레임의 카테고리와 동일한 열의 행을 합산하는 방법-Python

debugcn 에 게시 Dev

알폰소 마르티네즈 마르티네즈

로그 파일의 형식을 지정하는 작업을 진행 중이며 마지막으로 추가하려는 범주와 숫자가 동일한 열에있는 다음 데이터 프레임 샘플에 도달했습니다.

df = pd.DataFrame(dict(a=['Cat. A',1,1,3,'Cat. A',2,2,'Cat. B',3,5,2,6,'Cat. B',1,'Cat. C',4]))
>>> a
0   Cat. A
1   1
2   1
3   3
4   Cat. A
5   2
6   2
7   Cat. B
8   3
9   5
10  2
11  6
12  Cat. B
13  1
14  Cat. C
15  4

각 범주 아래의 모든 숫자를 합산하면 얻고 싶습니다.

Cat. A= 1+1+3+2+2 = 9
Cat. B= 3+5+2+6+1 = 17
Cat. C= 4

나는 고전적인 방식으로 모든 파일을 처리하는 방법을 알고 있지만 각 범주의 행 수는 가변적 일 수 있다는 점을 고려할 때 가장 비단뱀적인 방식으로 수행하는 방법을 알고 싶습니다. 카테고리가 각 데이터 프레임에 나타나는 시간도 다를 수 있습니다.

Ch3steR

우리가 사용할 수있는 pd.to_numeric비 숫자 필드 표시 nan사용을 Series.mask하고 Series.notna다음 그룹에 사용할. 그런 다음GroupBy.sum

a = pd.to_numeric(df['a'], errors='coerce')
g = df['a'].mask(a.notna()).ffill()
a.groupby(g).sum()

Cat. A     9.0
Cat. B    17.0
Cat. C     4.0
Name: a, dtype: float64

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

Pandas 데이터 프레임의 카테고리와 동일한 열의 행을 합산하는 방법-Python

Pandas 데이터 프레임의 카테고리와 동일한 열의 행을 합산하는 방법-Python

Python Pandas 데이터 프레임 : 동일한 이름의 두 열에서 작업을 수행하는 방법

동일한 Pandas 데이터 프레임의 열 값을 기반으로 행을 복제하는 방법

동일한 Pandas 데이터 프레임의 열 값을 기반으로 행을 복제하는 방법

Pandas에서 두 개의 동일한 데이터 프레임을 빼는 방법

Pandas의 동일한 데이터 프레임에있는 특정 행의 값을 사용하여 특정 열의 특정 행 값을 변경하는 방법

동일한 ID를 사용하지만 Python의 열에서 일부 다른 값을 가진 데이터 프레임의 레코드를 처리하는 방법

Pandas Python에서 다른 데이터 프레임의 특정 값을 조회하고 일치시키는 방법

Pandas 데이터 프레임의 동일한 열에서 값의 하위 문자열을 포함하는 행을 제거하는 가장 빠른 방법

한 데이터 프레임의 행을 Pandas의 다른 데이터 프레임의 열로 전치하는 최적의 방법은 무엇입니까?

동일한 Pandas 데이터 프레임에서 다른 열의 고유 한 문자열 값에 대해 1000, 1000 + 1을 할당하는 방법

열이 목록의 일부 값과 동일한 값을 갖는 Pandas 데이터 프레임에서 행을 필터링하는 방법

Pandas : Filter1 OR filter2와 일치하는 데이터 프레임의 행을 추출하는 방법

Python -Pandas : 빅 데이터 프레임의 모든 짝수 열을 동시에 선택하는 방법

Plotly : 동일한 Pandas 데이터 프레임의 다른 열에서 하나의 플롯 차트에 여러 줄을 그리는 방법은 무엇입니까?

Pandas에서 서로 다른 두 데이터 프레임의 열을 일치시켜 한 데이터 프레임의 열을 업데이트하는 방법

Python Pandas는 데이터 프레임의 일부 행을 복사하고 수정합니다.

몇 개의 행을 제외하고 데이터 프레임에서 행의 하위 집합을 가져 오는 방법 Python Pandas

Pandas는 다중 레벨 인덱스 데이터 프레임을 연결하고 동일한 레벨 내의 동일한 이름 열을 병합합니다.

Python Pandas는 두 데이터 프레임을 병합하고 한 데이터 프레임의 한 행을 다른 데이터 프레임의 모든 행에 매핑합니다.

여러 Pandas 데이터 프레임에서 동일한 열을 수집하고 이름을 바꾸는 방법

Python : 다른 Pandas 데이터 프레임 열 간의 평균을 계산하는 방법은 무엇입니까?

Pandas 데이터 프레임의 열을 반복하고 작업을 수행하는 방법

Python : 중복을 제거하지 않고 한 데이터 프레임의 열 값을 다른 데이터 프레임에서 바꾸는 방법

두 데이터 프레임의 일련 번호를 일치시키고 df2의 시리즈 목록 (행에서)을 df1 (Python, pandas)의 새 열에 추가하는 방법이 있습니까?

Python Pandas 한 데이터 프레임의 날짜를 다른 데이터 프레임의 날짜와 비교하는 방법은 무엇입니까?

Pandas 데이터 프레임에서 행의 모든 값을 평가하고 새 열에 쓰는 방법

Python Pandas 데이터 프레임의 각 행 아래에 24 개의 행을 추가하는 방법

Multiindex를 사용하여 Pandas 데이터 프레임의 단일 행을 여러 행으로 합산하는 방법은 무엇입니까?

Python / Pandas : 다른 데이터 프레임을 기반으로 데이터 프레임의 행과 열을 필터링하고 구성합니다.