卷积神经网络-多通道

容克斯

当输入层上存在多个通道时,卷积运算如何进行?(例如RGB)

在对CNN的体系结构/实现进行了一些阅读之后,我了解到特征图中的每个神经元都引用了由内核大小定义的图像的NxM个像素。然后,每个像素都通过特征图学习到的NxM权重集(内核/过滤器)进行分解,求和,然后输入到激活函数中。对于简单的灰度图像,我想该操作将遵循以下伪代码:

for i in range(0, image_width-kernel_width+1):
    for j in range(0, image_height-kernel_height+1):
        for x in range(0, kernel_width):
            for y in range(0, kernel_height):
                sum += kernel[x,y] * image[i+x,j+y]

        feature_map[i,j] = act_func(sum)
        sum = 0.0

但是我不明白如何扩展此模型以处理多个渠道。每个特征图是否需要三个单独的权重集,并且在每种颜色之间共享?

参考本教程的“共享权重”部分:http : //deeplearning.net/tutorial/lenet.html特征图中的每个神经元都引用了m-1层,其中颜色是从单独的神经元中引用的。我不明白他们在这里表达的关系。神经元是核还是像素,为什么它们引用图像的单独部分?

根据我的示例,似乎单个神经元内核是图像中特定区域所独有的。他们为什么将RGB分量分成几个区域?

地尔

当输入层上存在多个通道时,卷积运算如何进行?(例如RGB)

在这种情况下,每个输入通道(也称为平面)一个2D内核

因此,您分别执行每个卷积(2D输入,2D内核),然后对贡献进行求和,从而得出最终的输出特征图。

请参阅本的幻灯片64 CVPR 2014教程通过Marc'Aurelio Ranzato

在此处输入图片说明

每个特征图是否需要三个单独的权重集,并且在每种颜色之间共享?

如果考虑给定的输出要素图,则有3 x 2D内核(即每个输入通道一个内核)。每个2D内核在整个输入通道(此处为R,G或B)上共享相同的权重。

因此整个卷积层是一个4D张量(nb。输入平面x nb。输出平面x内核宽度x内核高度)。

他们为什么将RGB分量分成几个区域?

如上所述,可以将每个R,G和B通道视为具有专用2D内核单独输入平面。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

卷积神经网络如何仅给出通道数量而没有高度和宽度呢?

来自分类Dev

所有卷积神经网络都可以用于任意数量的通道图像吗?

来自分类Dev

转换为 CoreMLModel 的 Keras 卷积神经网络的输入是多阵列而不是图像?

来自分类Dev

为什么在卷积神经网络 3 个通道中卷积成 3 个通道时过滤器只产生 1 个通道

来自分类Dev

多类神经网络问题

来自分类Dev

组合卷积神经网络

来自分类Dev

卷积神经网络损失

来自分类Dev

深度信念网络与卷积神经网络

来自分类Dev

难以理解卷积神经网络

来自分类Dev

卷积神经网络(CNN)用于音频

来自分类Dev

卷积神经网络中的深度解释

来自分类Dev

TensorFlow卷积神经网络教程

来自分类Dev

卷积神经网络的识别类型

来自分类Dev

如何设计深度卷积神经网络?

来自分类Dev

卷积神经网络(CNN)输入形状

来自分类Dev

卷积神经网络的时间相关特征

来自分类Dev

TensorFlow卷积神经网络教程

来自分类Dev

卷积神经网络的成本函数

来自分类Dev

改变卷积神经网络中的参数

来自分类Dev

使用 openCV 的卷积神经网络

来自分类Dev

预训练卷积神经网络的微调

来自分类Dev

卷积神经网络中的恒定偏差

来自分类Dev

卷积神经网络上的 PCA 实现

来自分类Dev

在神经网络中使用卷积层

来自分类Dev

卷积深度信念网络(CDBN)与卷积神经网络(CNN)

来自分类Dev

如何理解多类神经网络的输出

来自分类Dev

卷积神经网络在火炬中。训练网络时出错

来自分类Dev

带最大池的卷积神经网络(CNN)

来自分类Dev

如何计算卷积神经网络的参数数量?