卷积神经网络-多通道

Junkers 发表于 Dev

容克斯

当输入层上存在多个通道时，卷积运算如何进行？（例如RGB）

在对CNN的体系结构/实现进行了一些阅读之后，我了解到特征图中的每个神经元都引用了由内核大小定义的图像的NxM个像素。然后，每个像素都通过特征图学习到的NxM权重集（内核/过滤器）进行分解，求和，然后输入到激活函数中。对于简单的灰度图像，我想该操作将遵循以下伪代码：

for i in range(0, image_width-kernel_width+1):
    for j in range(0, image_height-kernel_height+1):
        for x in range(0, kernel_width):
            for y in range(0, kernel_height):
                sum += kernel[x,y] * image[i+x,j+y]

        feature_map[i,j] = act_func(sum)
        sum = 0.0

但是我不明白如何扩展此模型以处理多个渠道。每个特征图是否需要三个单独的权重集，并且在每种颜色之间共享？

参考本教程的“共享权重”部分：http : //deeplearning.net/tutorial/lenet.html特征图中的每个神经元都引用了m-1层，其中颜色是从单独的神经元中引用的。我不明白他们在这里表达的关系。神经元是核还是像素，为什么它们引用图像的单独部分？

根据我的示例，似乎单个神经元内核是图像中特定区域所独有的。他们为什么将RGB分量分成几个区域？

地尔

当输入层上存在多个通道时，卷积运算如何进行？（例如RGB）

在这种情况下，每个输入通道（也称为平面）有一个2D内核。

因此，您分别执行每个卷积（2D输入，2D内核），然后对贡献进行求和，从而得出最终的输出特征图。

请参阅本的幻灯片64 CVPR 2014教程通过Marc'Aurelio Ranzato：

在此处输入图片说明

每个特征图是否需要三个单独的权重集，并且在每种颜色之间共享？

如果考虑给定的输出要素图，则有3 x 2D内核（即每个输入通道一个内核）。每个2D内核在整个输入通道（此处为R，G或B）上共享相同的权重。

因此整个卷积层是一个4D张量（nb。输入平面x nb。输出平面x内核宽度x内核高度）。

他们为什么将RGB分量分成几个区域？

如上所述，可以将每个R，G和B通道视为具有专用2D内核的单独输入平面。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-17

我来说两句

0条评论

登录后参与评论

上一篇：Scrapy，使用Python 3.4在终端中失败

来自分类Dev

Related 相关文章

文章

卷积神经网络-多通道

卷积神经网络-多通道

卷积神经网络如何仅给出通道数量而没有高度和宽度呢？

所有卷积神经网络都可以用于任意数量的通道图像吗？

转换为 CoreMLModel 的 Keras 卷积神经网络的输入是多阵列而不是图像？

为什么在卷积神经网络 3 个通道中卷积成 3 个通道时过滤器只产生 1 个通道

多类神经网络问题

组合卷积神经网络

卷积神经网络损失

深度信念网络与卷积神经网络

难以理解卷积神经网络

卷积神经网络（CNN）用于音频

卷积神经网络中的深度解释

TensorFlow卷积神经网络教程

卷积神经网络的识别类型

如何设计深度卷积神经网络？

卷积神经网络（CNN）输入形状

卷积神经网络的时间相关特征

TensorFlow卷积神经网络教程

卷积神经网络的成本函数

改变卷积神经网络中的参数

使用 openCV 的卷积神经网络

预训练卷积神经网络的微调

卷积神经网络中的恒定偏差

卷积神经网络上的 PCA 实现

在神经网络中使用卷积层

卷积深度信念网络（CDBN）与卷积神经网络（CNN）

如何理解多类神经网络的输出

卷积神经网络在火炬中。训练网络时出错

带最大池的卷积神经网络（CNN）

如何计算卷积神经网络的参数数量？