평균, 표준 편차, 표준 오류 및 목록의 값 개수 결정

debugcn 에 게시 Dev

DiscoA

data.txt2 개의 열과 80,667 개의 행을 포함하는 라는 텍스트 파일 이 있습니다. 처음 20 개 행은 모든 행을 나타냅니다.

  Column A     Column B

ACKR1/CCRL2     12.66
ACKR1/CMKLR1    10.41
ACKR1/CXCR4     13.01
ACKR1/FZD5      10.72
ACKR1/GPR107    10.22
ACKR1/GPR137    10.73
ACKR1/GPR146    11.93
ACKR1/TAPT1     11.24
ACKR1/TPRA1     11.81
ACKR1/XPR1      10.01
ACKR2/ACKR3     9.36
ACKR2/ACKR3     10.48
ACKR2/ACKR3     11.08
ACKR2/ACKR3     11.11
ACKR2/ACKR3     11.38
ACKR2/ACKR3     11.73
ACKR2/ACKR3     12.97
ACKR2/ADGRA2    8.68
ACKR2/ADGRA2    9.03
ACKR2/ADGRA2    9.34

보시다시피 A 열에 중복 된 값이 있습니다 (예 : ACKR2 / ACKR3, ACKR2 / ADGRA2). 내가하고 싶은 것은 results.txt고유 값의 평균, 표준 편차 및 표준 오차와 이들이 .NET에 나타나는 횟수를 포함하는 다른 파일 을 만드는 것입니다 data.txt. 예를 들면 :

   Value         Avg    Stdev    StdErr    Count

ACKR1/CCRL2     12.66    -         -         1
ACKR1/CMKLR1    10.41    -         -         1
ACKR1/CXCR4     13.01    -         -         1
ACKR1/FZD5      10.72    -         -         1
ACKR1/GPR107    10.22    -         -         1
ACKR1/GPR137    10.73    -         -         1
ACKR1/GPR146    11.93    -         -         1
ACKR1/TAPT1     11.24    -         -         1 
ACKR1/TPRA1     11.81    -         -         1
ACKR1/XPR1      10.01    -         -         1
ACKR2/ACKR3     11.46   0.84      0.35       7
ACKR2/ADGRA2    8.69    0.33      0.19       3

나는 표준 편차와 표준 오차를 모두 얻는 것에 대해 너무 단계적이지는 않지만 적어도 하나를 얻는 것이 좋을 것입니다.

저는 생물학 자라서 유닉스 스크립트 작성에 익숙하지 않습니다. 어디서부터 시작해야할지 모르겠습니다. 어떤 도움을 주시면 감사하겠습니다. 이전에 이와 같은 답변을 받으 셨다면 죄송합니다. 검색했지만 아무것도 찾을 수 없었습니다.

감사합니다!

카마 라즈

Stdev 및 Sterr 계산에 대해 확실하지 않습니다. 하지만이 방법을 사용하면 쉽게 계산할 수 있습니다.

$ awk '{A[$1]++;B[$1]+=$2}END{print "Value\t\tAvg\tCount";for (i in A){print i"\t"B[i]/A[i]"\t"A[i]}}' input.txt
Value           Avg     Count
ACKR2/ADGRA2    9.01667 3
ACKR1/GPR107    10.22   1
ACKR1/XPR1      10.01   1
ACKR1/CMKLR1    10.41   1
ACKR1/CCRL2     12.66   1
ACKR1/GPR146    11.93   1
ACKR1/GPR137    10.73   1
ACKR1/CXCR4     13.01   1
ACKR2/ACKR3     11.1586 7
ACKR1/TPRA1     11.81   1
ACKR1/FZD5      10.72   1
ACKR1/TAPT1     11.24   1

awk '{
A[$1]++;B[$1]+=$2
}
END
{
print "Value\t\tAvg\tCount";
for (i in A)
{
print i"\t"B[i]/A[i]"\t"A[i]
}
}'  input.txt

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-3

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

평균, 표준 편차, 표준 오류 및 목록의 값 개수 결정

평균, 표준 편차, 표준 오류 및 목록의 값 개수 결정

사전 목록의 Python 평균 및 표준 편차

R에서 양수 값과 음수 값에 대한 열별 평균 및 표준 편차 가져 오기

다중 샘플링 및 추세선을 사용하여 평균의 표준 편차 및 표준 오차 계산

평균 및 표준 편차 계산 및 0 값 무시

오라클의 각 행에 대한 평균 및 표준 편차 가져 오기

R에서 개별 그룹 간의 평균 및 표준 편차 계산

PySpark : 평균, 표준 편차 및 평균 주변 값을 한 번에 계산

C ++ 평균 및 표준 편차 계산

평균 및 표준 편차 계산

컬러 이미지 및 표준 편차의 평균 세트

목록이 미리 결정된 평균 x 및 표준을 갖도록 n (엄격히 양수) 값 목록을 생성합니다. dev. 와이

Excel의 조건부 표준 편차 및 표준 오차

R의 함수 : 동일한 함수 내에서 평균, 중앙값, 표준 편차를 반환하는 방법

별도의 배열에서 색인 된 요소의 평균 및 표준 편차

데이터 프레임의 0이 아닌 열의 평균 및 표준 편차

Math.Net을 사용한 배열의 평균 및 표준 편차

data.table을 사용한 행 평균 및 표준 편차

"# DIV / 0!"제거 평균 및 표준 편차 계산

루프를 사용하여 평균 및 표준 편차 찾기

열 평균 및 표준 편차 그룹 계산

평균, n, sd 및 표준 오류를 계산하는 Dplyr 함수

np.random.norm 함수를 몇 가지 평균 및 표준 편차 값에 적용하고 싶으므로 np.random.norm을 사용하여 6 개의 다른 시계열을 얻습니다.

부동 소수점으로 파일 읽기, 크기, 최대, 최소, 평균, 중앙값 및 표준 편차를 C로 계산

평균 / 표준 편차를 취하는 np.random.norm 함수

목록의 팬더 열 : 해당 열의 목록 길이에 대한 평균, 최대 길이 및 표준 편차를 얻는 방법

Pandas 데이터 프레임에서 5 개 행당 평균 및 표준 편차 계산

관세 별표 및 표준 오차 BELOW 계수 추정치

평균에서 표준 편차로 이상 값을 찾고 대규모 데이터 세트 (6000 개 이상의 열)에서 NA로 대체

이미지에서 각 채널 (RGB)의 평균 및 표준 편차를 얻는 방법