如何将 for 循环拆分为 3 个单独的数据框？

Question

matt

Asked: 2023-12-20 21:11:44 +0800 CST2023-12-20 21:11:44 +0800 CST 2023-12-20 21:11:44 +0800 CST

对于大小未知的 keras 层，是否可以知道特定输入的输出大小？

772

我们可以创建一个具有可变大小输入的卷积神经网络

ip = keras.layers.Input((None, None, 3))
op = keras.layers.Conv2D(3, (2, 2))(ip)

model=keras.models.Model(inputs = [ip], outputs = [op])

有没有办法知道特定输入的输出层操作的大小？

我知道有一个公式可以计算这个简单示例的大小。有没有办法让模型为我计算尺寸？

我可以做到的一种方法是运行一些示例数据。

x = numpy.random.random((1, 64, 64, 3))
y = model(x)

现在我可以看到它们的形状 1, 64, 64, 3 和 1, 63, 63, 3。

我的目标是能够使用不同的 cnn 网络，但我不知道如何计算一般大小，例如 Resnet101。我的输出有不同的缩放值，并且我希望能够在训练期间缩放我的地面实况数据。

我可以仅从模型和输入数据获取输出大小，而无需运行样本吗？

3 个回答

Voted

Axel Donath · Answer 1 · 2023-12-20T23:39:16+08:00

更新：正如@matt提到的，只需model用 new调用Input就足够了。无需为不同的输入创建新模型。然而，在这种情况下，需要保持各自的尺寸未指定。所以这不起作用：

import keras_core as keras

ip = keras.layers.Input((10, 10, 3))
op = keras.layers.Conv2D(3, (5, 5))(ip)
model = keras.models.Model(inputs = [ip], outputs = [op])

model(keras.layers.Input((100, 100, 3)))

虽然这确实：

import keras_core as keras

ip = keras.layers.Input((None, None, 3))
op = keras.layers.Conv2D(3, (5, 5))(ip)
model = keras.models.Model(inputs = [ip], outputs = [op])

model(keras.layers.Input((100, 100, 3)))

如果您仍然想要固定但不同的输入，则必须按照我下面建议的方式实现一些内容：

当你使用keras.layers.Input((100, 100, 3))它时，它实际上创建了一个KerasTensor对象，它似乎是一个惰性/未初始化的张量对象。通过递归地将其传递到其他层__call__，实际上修改了输出形状（不计算任何触发器）：

import keras_core as keras

ip = keras.layers.Input((100, 100, 3))
op = keras.layers.Conv2D(3, (5, 5))(ip)

print(op)

model = keras.models.Model(inputs = [ip], outputs = [op])

印刷：

<KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_39>

也可以通过获得相同的对象model.output。我想这里的解决方案是稍微重构您的代码并定义一个函数，该函数为给定的不同输入创建模型，大致如下：

import keras_core as keras

def create_model(ip):
    op = keras.layers.Conv2D(3, (5, 5))(ip)
    return keras.models.Model(inputs = [ip], outputs = [op])

model_1 = create_model(keras.layers.Input((10, 10, 3)))
model_2 = create_model(keras.layers.Input((100, 100, 3)))

print(model_1.output)
print(model_2.output)

哪个打印：

[<KerasTensor shape=(None, 6, 6, 3), dtype=float32, sparse=False, name=keras_tensor_54>]
[<KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_56>]

我希望这有帮助。

matt · Answer 2 · 2023-12-21T00:10:59+08:00

matt

2023-12-21T00:10:59+08:002023-12-21T00:10:59+08:00

根据特定输入获取大小。

inp = keras.layers.Input((64, 64, 3))
y = model(inp)

print(y)

现在输出是具有特定形状的定义张量，我认为在这种情况下它实际上并没有运行模型。

0

Mojtaba Abdi Khassevan · Answer 3 · 2023-12-20T22:10:33+08:00

Mojtaba Abdi Khassevan

2023-12-20T22:10:33+08:002023-12-20T22:10:33+08:00

总的来说，有一个著名的公式：

输出大小 = ((图像大小 - 内核大小)/(步幅大小)) + 1

当然，当考虑 padding = "same" 时，事情会变得有点复杂：

输出大小 = ((图像大小 - 内核大小 + 2 * 填充大小)/(步幅大小)) + 1

在哪里

填充大小 = (内核大小 - 1) / 2

使用后一个公式时请小心。有时它可能会让你失望。

-1

对于大小未知的 keras 层，是否可以知道特定输入的输出大小？

使用 <font color="#xxx"> 突出显示 html 中的代码

为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类？

您可以使用花括号初始化列表作为（默认）模板参数吗？

为什么列表推导式在内部创建一个函数？

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

为什么 'char -> int' 是提升，而 'char -> Short' 是转换（但不是提升）？

为什么库中不调用全局变量的构造函数？

std::common_reference_with 在元组上的行为不一致。哪个是对的？

C++17 中 std::byte 只能按位运算？

对于大小未知的 keras 层，是否可以知道特定输入的输出大小？

3 个回答

相关问题