data.txt
2 개의 열과 80,667 개의 행을 포함하는 라는 텍스트 파일 이 있습니다. 처음 20 개 행은 모든 행을 나타냅니다.
Column A Column B
ACKR1/CCRL2 12.66
ACKR1/CMKLR1 10.41
ACKR1/CXCR4 13.01
ACKR1/FZD5 10.72
ACKR1/GPR107 10.22
ACKR1/GPR137 10.73
ACKR1/GPR146 11.93
ACKR1/TAPT1 11.24
ACKR1/TPRA1 11.81
ACKR1/XPR1 10.01
ACKR2/ACKR3 9.36
ACKR2/ACKR3 10.48
ACKR2/ACKR3 11.08
ACKR2/ACKR3 11.11
ACKR2/ACKR3 11.38
ACKR2/ACKR3 11.73
ACKR2/ACKR3 12.97
ACKR2/ADGRA2 8.68
ACKR2/ADGRA2 9.03
ACKR2/ADGRA2 9.34
보시다시피 A 열에 중복 된 값이 있습니다 (예 : ACKR2 / ACKR3, ACKR2 / ADGRA2). 내가하고 싶은 것은 results.txt
고유 값의 평균, 표준 편차 및 표준 오차와 이들이 .NET에 나타나는 횟수를 포함하는 다른 파일 을 만드는 것입니다 data.txt
. 예를 들면 :
Value Avg Stdev StdErr Count
ACKR1/CCRL2 12.66 - - 1
ACKR1/CMKLR1 10.41 - - 1
ACKR1/CXCR4 13.01 - - 1
ACKR1/FZD5 10.72 - - 1
ACKR1/GPR107 10.22 - - 1
ACKR1/GPR137 10.73 - - 1
ACKR1/GPR146 11.93 - - 1
ACKR1/TAPT1 11.24 - - 1
ACKR1/TPRA1 11.81 - - 1
ACKR1/XPR1 10.01 - - 1
ACKR2/ACKR3 11.46 0.84 0.35 7
ACKR2/ADGRA2 8.69 0.33 0.19 3
나는 표준 편차와 표준 오차를 모두 얻는 것에 대해 너무 단계적이지는 않지만 적어도 하나를 얻는 것이 좋을 것입니다.
저는 생물학 자라서 유닉스 스크립트 작성에 익숙하지 않습니다. 어디서부터 시작해야할지 모르겠습니다. 어떤 도움을 주시면 감사하겠습니다. 이전에 이와 같은 답변을 받으 셨다면 죄송합니다. 검색했지만 아무것도 찾을 수 없었습니다.
감사합니다!
Stdev 및 Sterr 계산에 대해 확실하지 않습니다. 하지만이 방법을 사용하면 쉽게 계산할 수 있습니다.
$ awk '{A[$1]++;B[$1]+=$2}END{print "Value\t\tAvg\tCount";for (i in A){print i"\t"B[i]/A[i]"\t"A[i]}}' input.txt
Value Avg Count
ACKR2/ADGRA2 9.01667 3
ACKR1/GPR107 10.22 1
ACKR1/XPR1 10.01 1
ACKR1/CMKLR1 10.41 1
ACKR1/CCRL2 12.66 1
ACKR1/GPR146 11.93 1
ACKR1/GPR137 10.73 1
ACKR1/CXCR4 13.01 1
ACKR2/ACKR3 11.1586 7
ACKR1/TPRA1 11.81 1
ACKR1/FZD5 10.72 1
ACKR1/TAPT1 11.24 1
awk '{
A[$1]++;B[$1]+=$2
}
END
{
print "Value\t\tAvg\tCount";
for (i in A)
{
print i"\t"B[i]/A[i]"\t"A[i]
}
}' input.txt
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다