cublasSetMatrix 및 cublasSetVector 대신 cudaMemCpy 사용

debugcn 에 게시 Dev

마이클 풀 리아

cudaMalloc / cudaMemcpy를 사용하여 장치에 행렬과 벡터를 할당하는 응용 프로그램이 있습니다. 행렬은 열 중심으로 정의됩니다. 이제 cublas 라이브러리 (cublasSgemv)의 함수를 사용하여 이들을 함께 곱하고 싶습니다. cublas API 함수를 사용하려면 cudaMalloc을 사용하여 행렬과 벡터의 중복을 할당하고 호스트에서 cublasSetMatrix / cublasSetVector로 초기화해야 할 것 같습니다. 이 모든 메모리를 복제하는 것은 비용이 많이 듭니다.

내 이해에 따르면 cublasSetMatrix / cublasSetVector 함수는 cudaMemCpy의 가벼운 래퍼입니다. cudaMemCpy로 초기화 된 배열에 대한 포인터를 cublas API 함수에 전달할 수 있는지 궁금합니다. 아니면 API가 인식하는 방식으로 배열을 가볍게 래핑하여 모든 메모리 중복을 피할 수 있습니까?

로버트 크로 벨라

예, cublasGet / SetMatrix 대신 cudaMemcpy를 사용할 수 있습니다. CUBLAS도 함께 작동합니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-05-29

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

cublasSetMatrix 및 cublasSetVector 대신 cudaMemCpy 사용

cublasSetMatrix 및 cublasSetVector 대신 cudaMemCpy 사용

cublasSetVector () 대 cudaMemcpy ()

ScrollView 및 ForEach 대신 목록 사용

왜 항상 사용해야하나요 || 대신 | 및 & 대신 &&?

C에서 scanf () 및 printf () 대신 read () 및 write () 사용

int 및 double 대신 short 및 long 사용 (C ++)

실제 값 대신 python 및 pandas 인쇄 색인 사용

대기 및 신호 방법을 사용한 동기화

JXTable : 전체 열 대신 특정 셀에 TableCellEditor 및 TableCellRenderer 사용

JXTable : 전체 열 대신 특정 셀에 TableCellEditor 및 TableCellRenderer 사용

기본 + 및-대신 이미지 사용 트리보기

풍부한 ctags 대신 universal-ctags 설치 및 사용

C #에서 switch 문 대신 enum 및 struct 사용

* args 및 ** kwargs를 함수의 인수 대신 사용

수신 및 발신 DTO들에 대한 모범 사례

Telnet 대신 SSH를 사용하여 연결 및 포트 가용성 테스트

cudaMemcpy 전송 종류 : 기본 대 HostToDevice / DeviceToHost

jQuery 대신 for 사용

커널 호출 사이에 cudaMemcpy 제거

Typescript @Types 사용 및 기대

Posix Semaphore에서 공유 메모리 사용 C에서 대기 및 신호

sub 및 mov 대신 push / pop을 사용하는 이유는 무엇입니까?

for 루프 대신 map () 사용 및 더 짧은 (더 나은) 코드 작성

대 시선 및 신뢰 구간에 사용자 정의 ggplot 범례 추가

C # 성능-IntPtr 및 Marshal 대신 안전하지 않은 포인터 사용

각 POST 및 수신에 대해 두 개의 동일한 클래스 사용-REST

php date-콜론 대신 "h"및 "m"문자열을 사용하는 방법?

중첩 및 다중 foreach 문 대신 LINQ 또는 Lambda를 사용하는 방법

ssh 대신 rsh를 사용하는 GNU 병렬 및 다중 노드

postfix 및 dovecot은 / var / spool / mail 대신 / root / Maildir을 사용합니다.