如何使用openMP并行处理内部循环?

安德里亚

也许我的问题的解决方案非常明显。我想使用openMP加速以下代码(插入Intel Xeon Phi),但是我不能。

int c=0, d=0, e=0, i;
#pragma opm parallel for private(c, d, e)
for(i=0; i < columns; i++)
{
  if((left_side[rule*columns + i] > 0) || (right_side[rule*columns + i] > 0))
  {
    for(c=0; c < rows; c++)
    {
      if(left_side[i + c * columns] > 0)
      {
        if(flag[c] == 0)
        {
          r_prob[c] = c_vect[c];
          flag[c] = 1;
          for(d=0; d < columns; d++)
          {
            switch(left_side[c * columns + d])
            {
              case 0:
                break;
              case 1:
                r_prob[c] *= M_in[d] * 1.0;
                break;
              case 2:
                r_prob[c] *= (M_in[d] * (M_in[d] - 1)) * .5;
                break;
              default:
                for(e=1; e <= left_side[c * columns + d]; e++)
                  r_prob[c] *= M_in[d] * 1.0 / (e * 1.0);
                break;
            }
          }
        }
      }
    }
  }
}
//where r_prob, M_in, left_side, right_side, c_vect and flag are array that are in input.

该代码无法正确运行,r_prob中的值错误。我如何并行化此代码?

罗杰·菲格罗亚·昆特罗

您的代码有错误,因为第一个FOR创建了多个线程,并且这些线程同时写入了数组r_prob,标志。解决方案可能是:

int c=0, d=0, e=0, i;
#pragma opm parallel for private(c, d, e)
 for(i=0; i < columns; i++)
 {

 if((left_side[rule*columns + i] > 0) || (right_side[rule*columns + i] > 0))
 {
  for(c=0; c < rows; c++)
  {
  if(left_side[i + c * columns] > 0)
  {
    if(flag[c] == 0)
    {
       #pragma omp critical //Only one thread at a time can enter 
      { 
      r_prob[c] = c_vect[c];
      flag[c] = 1;
      }

      for(d=0; d < columns; d++)
      {
        switch(left_side[c * columns + d])
        {
          case 0:
            break;
          case 1:
             #pragma omp critical //Only one thread at a time can enter 
             { 
            r_prob[c] *= M_in[d] * 1.0;
              }
            break;
          case 2:
             #pragma omp critical //Only one thread at a time can enter 
             { 
            r_prob[c] *= (M_in[d] * (M_in[d] - 1)) * .5;
             }
            break;
          default:
            for(e=1; e <= left_side[c * columns + d]; e++)
               #pragma omp critical //Only one thread at a time can enter 
               {
              r_prob[c] *= M_in[d] * 1.0 / (e * 1.0);
              }
            break;
           }
          }
       }
     }
   }
 }
}//where r_prob, M_in, left_side, right_side, c_vect and flag are array that are in input.

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用openMP并行处理主要查找器

来自分类Dev

使用多处理池的并行处理循环

来自分类Dev

与OpenMP并行化-如何?

来自分类Dev

我应该并行处理哪些循环,外部循环还是内部循环

来自分类Dev

使用openmp并行计算循环

来自分类Dev

不使用$ OMP DO的OpenMP并行循环

来自分类Dev

使用OpenMP并行化嵌套循环

来自分类Dev

OpenMP:创建线程,并行处理,循环障碍

来自分类Dev

如何使用OpenMP并行化此数组总和?

来自分类Dev

OpenMP-并行循环

来自分类Dev

使用OpenMP并行化的嵌套循环运行缓慢

来自分类Dev

如何在Python中使用多重处理并行求和循环

来自分类Dev

使用OpenMP通过c ++列表/迭代器并行处理两个for循环

来自分类Dev

如何使用OpenMP编译在OS X中并行处理R包xgboost?

来自分类Dev

OpenMP从并行for循环调用并行化函数

来自分类Dev

如何使用OpenMP并行化最近邻居搜索

来自分类Dev

使用内部循环减少的openmp崩溃

来自分类Dev

如何在OpenMP中并行化循环?

来自分类Dev

OpenMP,并行减少for循环

来自分类Dev

不使用$ OMP DO的OpenMP并行循环

来自分类Dev

使用openmp并行计算循环

来自分类Dev

如何使用openmp并行化代码以减少矩阵加和

来自分类Dev

如何通过使用GCD(大型中央调度)来使用“循环”并行处理

来自分类Dev

OpenMP,并行进行循环,处理时间差异很大

来自分类Dev

OpenMP从并行for循环调用并行化函数

来自分类Dev

实现for循环的并行处理

来自分类Dev

在C中使用OpenMP进行循环并行化的线程数

来自分类Dev

使用 OpenMP 正确/高效地并行化 for 循环

来自分类Dev

如何使用 OpenMP 在其他 for 循环中并行化 for 循环

Related 相关文章

热门标签

归档