Keras模型的自定义损失函数给出错误答案

debugcn 发表于 Dev

标签

我正在尝试为keras NN模型编写自定义损失函数，但似乎损失函数输出了错误的值。我的损失函数是

def tangle_loss3(input_tensor):
    def custom_loss(y_true, y_pred):
        true_diff = y_true - input_tensor
        pred_diff = y_pred - input_tensor
        
        normalized_diff = K.abs(tf.math.divide(pred_diff, true_diff))
        normalized_diff = tf.reduce_mean(normalized_diff)
        
        return normalized_diff
    
    return custom_loss

然后在简单的前馈网络中使用它：

input_layer = Input(shape=(384,), name='input')
hl_1 = Dense(64, activation='elu', name='hl_1')(input_layer)
hl_2 = Dense(32, activation='elu', name='hl_2')(hl_1)
hl_3 = Dense(32, activation='elu', name='hl_3')(hl_2)
output_layer = Dense(384, activation=None, name='output')(hl_3)

optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)

model = tf.keras.models.Model(input_layer, output_layer)
model.compile(loss=tangle_loss3(input_layer), optimizer=optimizer)

然后，为了测试损失函数是否起作用，我创建了一个随机输入和目标向量，并对期望值进行了numpy计算，但这似乎与keras的结果不匹配。

X = np.random.rand(1, 384)
y = np.random.rand(1, 384)

np.mean(np.abs((model.predict(X) - X)/(y - X)))
# returns some number 

model.test_on_batch(X, y)
# always returns 0.0

为什么我的损失函数总是返回零？这些答案应该匹配吗？

Niteya Shah |

我误解了您的问题，并且更新了我的方法。它现在应该可以工作。我堆叠输入层和输出层以获得传递给输出的新层。


    def tangle_loss3(y_true, y_pred):
        true_diff = y_true - y_pred[0]
        pred_diff = y_pred[1] - y_pred[0]
    
        normalized_diff = tf.abs(tf.math.divide(pred_diff, true_diff))
        normalized_diff = tf.reduce_mean(normalized_diff)
    
        return normalized_diff

    input_layer = Input(shape=(384,), name='input')
    hl_1 = Dense(64, activation='elu', name='hl_1')(input_layer)
    hl_2 = Dense(32, activation='elu', name='hl_2')(hl_1)
    hl_3 = Dense(32, activation='elu', name='hl_3')(hl_2)
    output_layer = Dense(384, activation=None, name='output')(hl_3)
    out = tf.stack([input_layer, output_layer])
    
    optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)
    
    model = tf.keras.models.Model(input_layer, out)
    model.compile(loss=tangle_loss3, optimizer=optimizer)

现在当我计算损失时


    X = np.random.rand(1, 384)
    y = np.random.rand(1, 384)
    
    np.mean(np.abs((model.predict(X)[1] - X)/(y - X)))
    # returns some number
    
    model.test_on_batch(X, y)

注意，当我们得到两个输出时，我必须使用model.predict（X）[1]，即输入层和输出层的结果。这只是一个骇人听闻的解决方案，但确实有效。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。