데이터 스트림에서 효율적으로 최대 및 최소 계산

debugcn 에 게시 Dev

마티아 서 리키 오

저는 데이터 스트림으로 C에서 작업하고 있습니다. 기본적으로 n 밀리 초마다 6 개 요소의 열 배열을받습니다. 각 데이터 행의 최대 값을 계산하고 싶습니다.

이를 명확히하기 위해 이것은 내 데이터의 모습입니다 (이것은 장난감 예제이며 실제로 수천 개의 열을 획득 할 것입니다).

[6] [-10] [5]
[1] [5]   [3]
[5] [30]  [10]
[2] [-10] [0]
[-2][5]   [10]
[-5][0]   [1]

그래서 기본적으로 (말했듯이) n 밀리 초마다 데이터 열을 수신하고 최대 및 최소 값을 행 단위로 계산하고 싶습니다. 따라서 이전 예에서 결과는 다음과 같습니다.

max_values=[6,5,30,2,10,1]
min_values=[-10,1,5,-10,-2,-5]

나는 전체 행렬에 액세스 할 수 없으며 n 밀리 초마다 수신하는 6 개 요소의 단일 열에 대해서만 작업 할 수 있음을 지적하고 싶습니다.

이것은 지금까지의 간단한 코드 알고리즘입니다 (더 큰 프로젝트의 일부이므로 전체 코드를 생략하겠습니다).

 for(int i=0;i<6;i++){
        if(input[i]>temp_max[i]){
            temp_max[i]=input[i];
        }
        if(input[i]<temp_min[i]){
            temp_min[i]=input[i];
        }

    }

여기서 input, temp_max그리고 temp_min모두 차원 6의 부동 배열입니다. 기본적으로 내 코드는 새 입력 배열을 사용할 수있을 때마다이 코드를 실행하고 그에 따라 최대 값과 최소값을 업데이트합니다.

성능에 관심이 있기 때문에 (임베디드 시스템에서 실행 됨) 코드의이 부분을 개선 할 수있는 방법이 있습니까? 두 배열의 각 단일 요소에 대한 비교를 호출하는 것은 가장 현명한 생각이 아닙니다.

제롬 리차드

분기는 특히 임베디드 시스템에서 느립니다 . 스칼라 계산도 마찬가지 입니다. 바라건대, 타겟 프로세서가 NEON SIMD 명령어 세트를 지원하는 ARM 기반 프로세서 인 것 같습니다 (분명히 64 비트 ARM-V8 A53 아키텍처를 기반으로하는 프로세서 ). NEON은 행에서 4 개의 32 비트 부동 소수점 연산을 계산할 수 있습니다. 이것은 현재 코드 (컴파일러가 분명히 벡터화에 실패 함)보다 훨씬 빠릅니다.

다음은 예제 코드입니다 (테스트되지 않음).

void minmax_optim(float temp_min[6], float temp_max[6], float input[6]) {
    /* Compute the first 4 floats */

    float32x4_t vInput = vld1q_f32(input);
    float32x4_t vMin = vld1q_f32(temp_min);
    float32x4_t vMax = vld1q_f32(temp_max);

    vMin = vminq_f32(vInput, vMin);
    vMax = vmaxq_f32(vInput, vMax);
    vst1q_f32(temp_min, vMin);
    vst1q_f32(temp_max, vMax);

    /* Remainder 2 floats */

    float32x2_t vLastInput = vld1_f32(input+4);
    float32x2_t vLastMin = vld1_f32(temp_min+4);
    float32x2_t vLastMax = vld1_f32(temp_max+4);

    vLastMin = vmin_f32(vLastInput, vLastMin);
    vLastMax = vmax_f32(vLastInput, vLastMax);
    vst1_f32(temp_min+4, vLastMin);
    vst1_f32(temp_max+4, vLastMax);
}

결과 코드는 훨씬 빨라야합니다. 이 벡터화 된 구현의 명령어 수가 조건부 점프 명령어가없는 참조 구현보다 훨씬 적다는 것을 금 볼트에서 볼 수 있습니다 .

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-5

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

데이터 스트림에서 효율적으로 최대 및 최소 계산

데이터 스트림에서 효율적으로 최대 및 최소 계산

Java에서 최소 및 최대 계산?

배열에서 최소 3 개 이상의 최소 및 최대 수 계산

최대 및 최소 타임 스탬프가있는 행에서 효율적으로 선택

최소 및 최대 값을 계산할 때 문자열에서 Double 유형으로의 변환이 유효하지 않습니다.

Pandas 데이터 프레임 날짜 시간 변환 및 최소 / 최대 계산

SpatialLinesDataFrame 객체에서 계산 된 최소 및 최대 좌표

R에서 최소, 최대 및 평균 계산

Numpy : 마스킹 된 배열 쌓기 및 최소 / 최대 계산

선형 데이터 분할 및 데이터 최대 계산 PHP

쿼리 최적화-SQL에서 효율적으로 일대 다 관계 테이블의 결과 조합

Hadoop에서 Oracle 핸들 삭제 및 최소 중단 시간으로 데이터를 내보내는 효율적인 방법은 무엇입니까?

파이썬에서 하루 중 시간을 기준으로 매분 최대 및 최소값에서 노출 시간을 계산하는 방법

포인터로 최대 및 최소

가속도계의 최소 및 최대 값 범위 및 센서 데이터 변환

카산드라 : 값 삽입 및 평균 / 최소 / 최대 업데이트

두 벡터의 공통 요소에 대한 인덱스를 효율적으로 계산

대상 ID별로 실행 길이 시퀀스 및 최대 값 계산

어떻게 효율적으로 팬더의 dataframe에서 최대를 실행 계산하려면?

Excel에서 최대에서 최소로 데이터 정렬

각 고유 항목에 대한 최대 및 최소를 계산하는 방법

SQL Server의 Datetime 문자열 목록에서 최소, 최대 및 평균 계산

postgresql에서 최대, 최소 및 평균을 계산하는 방법

Int에 대한 최소 및 최대 값 설정? 기계적 인조 인간

C # SslStream에서 지속적으로 읽기 (긴 연결, 최대 며칠 지속) 및 무한 루프없이 효율적으로 읽기

sqlite 데이터베이스의 최대 행 수? (효율적으로 쿼리하기 위해)

SQL Server에서 최대 및 최소 한도가있는 누적 합계

부분적으로 중복 된 행에 대한 Pandas, 행 유지 및 데이터를 최소값 또는 최대 값으로 교체

튜플 파이썬으로 사전에서 최대 및 최소 찾기

시계열 하이 차트에서 최소 및 최대 확대 / 축소를 설정할 수 있습니까?