我正在使用CUFFT库在尺寸为128 x 128的128张图像上进行2D FFT。我使用该库的方式如下:
unsigned int nx = 128; unsigned int ny = 128; unsigned int nz = 128;
// Make 2D fft batch plan
int n[2] = {nx, ny};
int inembed[] = {nx, ny};
int onembed[] = {nx, ny};
cufftPlanMany(&plan,
2, // rank
n, // dimension
inembed,
1, // istride
nx * ny, // idist
onembed,
1, //ostride
nx * ny, // odist
CUFFT_D2Z,
nz);
cufftSetCompatibilityMode(plan,CUFFT_COMPATIBILITY_NATIVE)
// Create output array
complex<double>* out_complex = new complex<double>[nx * ny * nz];
// Initialize output array
for (unsigned int i = 0; i < nx * ny * nz; i++) {
out_complex[i].real(0);
out_complex[i].imag(0);
}
cudaMalloc( (void**)&idata, sizeof(cufftDoubleReal) * nx * ny * nz );
cudaMalloc( (void**)&odata, sizeof(cufftDoubleComplex) * nx * ny * nz );
cudaMemcpy( idata, in_real, nx * ny * nz * sizeof(cufftDoubleReal),
cudaMemcpyHostToDevice ) );
cudaMemcpy( odata, out_complex, nx * ny * nz * sizeof(cufftDoubleComplex),
cudaMemcpyHostToDevice ) );
cufftExecD2Z( plan, idata, odata );
cudaMemcpy( out_complex, odata, nx * ny * nz * sizeof(cufftDoubleComplex),
cudaMemcpyDeviceToHost ) );
主机上的输入in_real是保存3D图像的大数组,它是双精度数组。我猜应该没有问题,从cufftDoubleReal到double的转换和从cufftDoubleComplex到double的转换是没有问题的?我对计划的制定方式和参数有些怀疑,我试图在网上找到一些示例,但它们并没有帮助或一致。然后,我会根据自己的理解,通过编程指南来设置参数。
如标题所示,输出部分正确(左半平面),右半平面为零,这让我感到困惑。我尝试设置不同类型的兼容模式,但没有帮助。我要比较的版本是MATLAB fft2()。
您需要(重新)阅读文档,以进行实际到复杂的转换。报价单:
在许多实际应用中,输入向量是实值。可以很容易地看出,在这种情况下,输出满足厄米对称性(X k = XN-k ∗,其中星号表示复共轭)。反之亦然:对于复杂的Hermitian输入,逆变换将是纯实值。cuFFT利用了这种冗余,仅在Hermitian向量的前半部分起作用
也就是说,实数到复数变换的输出是对称的,而cuFFT通过不计算冗余(对称)系数来利用这一点。因此,通常只获得转换输出的“一半”是正常的,因为另一个“一半”是相同的。这并不是cuFFT,FFTW和大多数其他高性能FFT库所独有的,这种方式适用于实数到复数变换和复数到实数逆变换。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句