将 tf.keras.metrics.Precision 添加到 TensorFlow 中的模型指标时出现 ValueError

Question

Fred Myers

Asked: 2025-01-20 08:52:43 +0800 CST2025-01-20 08:52:43 +0800 CST 2025-01-20 08:52:43 +0800 CST

为什么训练集越大，TensorFlow 损失就越大？

772

我创建了一个非常简单的 TensorFlow 模型，如果我有一组训练数据，它就可以工作。但是，如果我再添加一个训练示例，那么损失就会变为无穷大，模型就无法工作了。尽管这两个示例的模型是相同的。唯一的区别是增加了一个训练示例。

我想制作一个大型训练集，但如果训练集太大，损失会发散，这似乎是不可能的。在有额外训练示例的情况下，预测也完全错误。在少一个示例的情况下，预测是正确的。在下面的代码中，模型有 20 个训练示例，损失趋于无穷大。模型 2 有 19 个训练示例，损失函数趋于（接近）零。

<pre>    
    import tensorflow as tf
    import numpy as np
    from tensorflow import keras

    print(tf.__version__)``

    def hw_function(x):
        y = (2. * x) - 1.
        return y

    # Build a simple Sequential model
    model = tf.keras.Sequential([
        tf.keras.Input(shape=(1,)),
        tf.keras.layers.Dense(units=1)])

    # Compile the model
    model.compile(optimizer='sgd', loss='mean_squared_error')

    # Declare model inputs and outputs for training
    xs=[x for x in range(-1, 19, 1)]
    ys=[x for x in range(-3, 36, 2)]

    xs=np.array(xs, dtype=float)
    ys=np.array(ys, dtype=float)

    # Train the model
    model.fit(xs, ys, verbose=1, epochs=500)

    # Make a prediction
    p = np.array([100.0, 900.0], dtype=float)
    print(model.predict(p))


    # Build exactly the same model but have one more training example
    model2 = tf.keras.Sequential([
        tf.keras.Input(shape=(1,)),
        tf.keras.layers.Dense(units=1)])
    model2.compile(optimizer='sgd', loss='mean_squared_error')
    xs2=[x for x in range(-1, 18, 1)]
    ys2=[x for x in range(-3, 34, 2)]

    xs2=np.array(xs2, dtype=float)
    ys2=np.array(ys2, dtype=float)

    # Train the model
    model2.fit(xs2, ys2, verbose=1, epochs=500)
    p = np.array([100.0, 900.0], dtype=float)
    print(model2.predict(p))
<code>

1 个回答

Voted

xdurch0 · Answer 1 · 2025-01-20T17:07:26+08:00

Best Answer

xdurch0

2025-01-20T17:07:26+08:002025-01-20T17:07:26+08:00

这与示例数量无关，而是与数据的数值大小有关。例如，您可以扩展“以下”数据集，它仍然有效：

xs=[x for x in range(-2, 18, 1)]
ys=[x for x in range(-5, 34, 2)]

您可能已经找到了优化开始变得不稳定的确切数值阈值。您可以通过降低学习率来解决这个问题。对于“较大”的数据集，此方法会失败：

opt = tf.keras.optimizers.SGD(learning_rate=0.01)
model.compile(optimizer=opt, loss='mean_squared_error')

这很好用：

opt = tf.keras.optimizers.SGD(learning_rate=0.001)
model.compile(optimizer=opt, loss='mean_squared_error')

至于预测“完全错误”，我无法重现。它们略有偏差，但这是因为参数不完全匹配。例如，在一个例子中，我得到的1.996 * x - 0.9469是，而不是2 * x - 1，这相当接近，但对于像 100 或 900 这样的大输入，差异会更大。

1

为什么训练集越大，TensorFlow 损失就越大？

重新格式化数字，在固定位置插入分隔符

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

为什么训练集越大，TensorFlow 损失就越大？

1 个回答

相关问题