即使输出层有任何大小，keras神经网络如何找到要归类的类？

debugcn 发表于 Dev

拉富

我有一个带有二进制类（对或错）的数据样本。神经网络赋予每个班级权重，最大值将决定归属的班级。但是，即使输出层没有适当数量的神经元，为什么角膜也能起作用？（在我的情况下，=类数= 2，即0或1）。

import keras
from model import *

X_train, X_test, y_train, y_test = train_test_split(df_features, df_labels, test_size=0.25, random_state=10)

model = keras.Sequential([
    keras.layers.Flatten(input_shape=(len(X_test.columns),)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(128, activation='softmax') # Shouldn't be two here ?
])

model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

# len(y_train.columns) == 1
history = model.fit(X_train, y_train, epochs=100, validation_split=0.25)

scores = model.evaluate(X_test, y_test, verbose=0)

print(model.metrics_names)
print('scores=', scores)

假设：它在末尾添加了一个隐式层，或者它忽略了某些神经元，或者完全是其他东西？

编辑：添加数据

>>> print(y_train)
[0 0 0 ... 0 1 0]

>>> print(y_test)
      Class
1424      0
3150      1
2149      0
1700      0
4330      0
4200      0
# etc, ~1000 entries
>>> print('len(y_train)=', len(y_train))
len(y_train)= 2678
>>> print('len(y_test)=', len(y_test))
len(y_test)= 893

阿克塞·塞加尔（Akshay Sehgal）

我认为问题在于您的损失如何sparse_cartegorical_crossentropy运作。这种损失（与相对categorical_crossentropy）假定y_actual将作为标签编码格式而不是单热编码格式提供。这意味着，如果要预测5个类别，则将提供y_actual数组，[0,2,4,1,2,2,3,3,1...]其中1-D数组中的每个值代表5个可能类别中的一个类别编号。

让我们直接从tf2文档中查看有关此损失的独立用法的示例-

y_true = [1, 2] #class number from 0 to 2
y_pred = [[0.05, 0.95, 0], [0.1, 0.8, 0.1]] #3 class classification output
loss = tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred)
assert loss.shape == (2,)
loss.numpy()

[0.0513, 2.253]

在您的情况下，这意味着当模型返回128维输出时，它将假定此分类问题中有128个类。但是，由于损失为sparse_categorical_crossentropy，因此它将等待接收0-127之间的单个数字，然后将其用于计算其错误。

由于在所有情况下都始终将其设置为0或1，因此假定样本所属的实际类仅是128个类中的0或1类，而其他所有类都不是。因此，它可以运行代码，但是它是有缺陷的，因为它假定它属于128个其他类中的一个，而不是作为二进制类读取y_train（或从y_test）获得的一位数字。

print(y_train)
[0 0 0 ... 0 1 0]

#The first 0 here, is being considered as one class out of 128 other classes. 
#The code would still work if u changed that to say 105 instead of 0.
#Similarly for all the other 0s and 1s.

希望这是有道理的。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

即使输出层有任何大小，keras神经网络如何找到要归类的类？

即使输出层有任何大小，keras神经网络如何找到要归类的类？

如何理解多类神经网络的输出

如何计算神经网络隐藏层中神经元的目标输出？

这两种在Keras中添加神经网络层的方式有什么区别？

这两种在Keras中添加神经网络层的方式有什么区别？

神经网络输出

如何在神经网络的输出层计算二阶导数？

如何在神经网络的输出层计算二阶导数？

神经网络回归：缩放输出还是使用线性层？

如何改善神经网络输出？

在实现具有多个输出的神经网络时遇到keras的错误

如果不知道游戏的目标输出，我将如何找到神经网络的成本？

输出量的大小（卷积神经网络）

如何通过辍学层改善神经网络？

如何在神经网络中删除整个隐藏层？

如何初始化 1 层神经网络参数？

提高神经网络输出中负类的精度

使用Keras的神经网络

有什么方法可以改变卷积神经网络中完全连接层的默认输出形状吗？

神经网络的大量输出

Keras：如何将输入直接输入到神经网络的其他隐藏层中？

如何制作具有回归和分类输出的神经网络？

如何设置神经网络使其输出只有 0 或 1？

具有连续/浮点输出的tensorflow神经网络？

具有连续/浮点输出的tensorflow神经网络？

使神经网络具有分层输出是否更好？

是否可以训练具有“拆分”输出的神经网络

消除神经网络层的偏差

神经网络中的“层”是什么

设计神经网络的隐藏层