是否有一种方便有效的方式以NUMA感知方式使用cpp标准容器API?
我想在cpp环境中执行OpenMP并行稀疏矩阵向量乘法。为了分配和初始化与NUMA域有关的向量和矩阵值,C代码将看起来像这样:
size_t N = 1000000;
double* vecVal = malloc (N*sizeof(double));
#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
vecVal[i] = 0.;
}
/* do spMV */
delete vecVal;
在Cpp中,我想使用std :: vector(具有固定大小的std :: array也可以)。std :: vector :: reserve()是否能解决问题?这样做是合法的:
std::vector<double> vec;
vec.reserve(N);
double *vecVal = vec.data();
#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
vecVal[i] = 0.;
}
/* do spMV */
然后,我该如何为std :: vector设置正确的大小?
有谁知道更优雅的方式?
您必须在此处使用特殊的Numa感知分配器。我们在这里为HPX实施了类似的操作:https : //github.com/STEllAR-GROUP/hpx/blob/master/hpx/parallel/util/numa_allocator.hpp
基本思想是使分配器内部具有分配功能的第一手接触。用您的#omp parallel for schedule(static)
循环替换HPX执行程序的东西,您应该没事。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句