AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / coding / 问题 / 77691855
Accepted
matt
matt
Asked: 2023-12-20 21:11:44 +0800 CST2023-12-20 21:11:44 +0800 CST 2023-12-20 21:11:44 +0800 CST

对于大小未知的 keras 层,是否可以知道特定输入的输出大小?

  • 772

我们可以创建一个具有可变大小输入的卷积神经网络

ip = keras.layers.Input((None, None, 3))
op = keras.layers.Conv2D(3, (2, 2))(ip)

model=keras.models.Model(inputs = [ip], outputs = [op])

有没有办法知道特定输入的输出层操作的大小?

我知道有一个公式可以计算这个简单示例的大小。有没有办法让模型为我计算尺寸?

我可以做到的一种方法是运行一些示例数据。

x = numpy.random.random((1, 64, 64, 3))
y = model(x)

现在我可以看到它们的形状 1, 64, 64, 3 和 1, 63, 63, 3。

我的目标是能够使用不同的 cnn 网络,但我不知道如何计算一般大小,例如 Resnet101。我的输出有不同的缩放值,并且我希望能够在训练期间缩放我的地面实况数据。

我可以仅从模型和输入数据获取输出大小,而无需运行样本吗?

python
  • 3 3 个回答
  • 43 Views

3 个回答

  • Voted
  1. Best Answer
    Axel Donath
    2023-12-20T23:39:16+08:002023-12-20T23:39:16+08:00

    更新:正如@matt提到的,只需model用 new调用Input就足够了。无需为不同的输入创建新模型。然而,在这种情况下,需要保持各自的尺寸未指定。所以这不起作用:

    import keras_core as keras
    
    ip = keras.layers.Input((10, 10, 3))
    op = keras.layers.Conv2D(3, (5, 5))(ip)
    model = keras.models.Model(inputs = [ip], outputs = [op])
    
    model(keras.layers.Input((100, 100, 3)))
    

    虽然这确实:

    import keras_core as keras
    
    ip = keras.layers.Input((None, None, 3))
    op = keras.layers.Conv2D(3, (5, 5))(ip)
    model = keras.models.Model(inputs = [ip], outputs = [op])
    
    model(keras.layers.Input((100, 100, 3)))
    

    如果您仍然想要固定但不同的输入,则必须按照我下面建议的方式实现一些内容:

    当你使用keras.layers.Input((100, 100, 3))它时,它实际上创建了一个KerasTensor对象,它似乎是一个惰性/未初始化的张量对象。通过 递归地将其传递到其他层__call__,实际上修改了输出形状(不计算任何触发器):

    import keras_core as keras
    
    ip = keras.layers.Input((100, 100, 3))
    op = keras.layers.Conv2D(3, (5, 5))(ip)
    
    print(op)
    
    model = keras.models.Model(inputs = [ip], outputs = [op])
    

    印刷:

    <KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_39>
    

    也可以通过 获得相同的对象model.output。我想这里的解决方案是稍微重构您的代码并定义一个函数,该函数为给定的不同输入创建模型,大致如下:

    import keras_core as keras
    
    def create_model(ip):
        op = keras.layers.Conv2D(3, (5, 5))(ip)
        return keras.models.Model(inputs = [ip], outputs = [op])
    
    model_1 = create_model(keras.layers.Input((10, 10, 3)))
    model_2 = create_model(keras.layers.Input((100, 100, 3)))
    
    print(model_1.output)
    print(model_2.output)
    

    哪个打印:

    [<KerasTensor shape=(None, 6, 6, 3), dtype=float32, sparse=False, name=keras_tensor_54>]
    [<KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_56>]
    

    我希望这有帮助。

    • 0
  2. matt
    2023-12-21T00:10:59+08:002023-12-21T00:10:59+08:00

    根据特定输入获取大小。

    inp = keras.layers.Input((64, 64, 3))
    y = model(inp)
    
    print(y)
    

    现在输出是具有特定形状的定义张量,我认为在这种情况下它实际上并没有运行模型。

    • 0
  3. Mojtaba Abdi Khassevan
    2023-12-20T22:10:33+08:002023-12-20T22:10:33+08:00

    总的来说,有一个著名的公式:

    输出大小 = ((图像大小 - 内核大小)/(步幅大小)) + 1

    当然,当考虑 padding = "same" 时,事情会变得有点复杂:

    输出大小 = ((图像大小 - 内核大小 + 2 * 填充大小)/(步幅大小)) + 1

    在哪里

    填充大小 = (内核大小 - 1) / 2

    使用后一个公式时请小心。有时它可能会让你失望。

    • -1

相关问题

  • 如何将 for 循环拆分为 3 个单独的数据框?

  • 如何检查 Pandas DataFrame 中的所有浮点列是否近似相等或接近

  • “load_dataset”如何工作,因为它没有检测示例文件?

  • 为什么 pandas.eval() 字符串比较返回 False

  • Python tkinter/ ttkboostrap dateentry 在只读状态下不起作用

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    使用 <font color="#xxx"> 突出显示 html 中的代码

    • 2 个回答
  • Marko Smith

    为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类?

    • 1 个回答
  • Marko Smith

    您可以使用花括号初始化列表作为(默认)模板参数吗?

    • 2 个回答
  • Marko Smith

    为什么列表推导式在内部创建一个函数?

    • 1 个回答
  • Marko Smith

    我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

    • 1 个回答
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 个回答
  • Marko Smith

    为什么 'char -> int' 是提升,而 'char -> Short' 是转换(但不是提升)?

    • 4 个回答
  • Marko Smith

    为什么库中不调用全局变量的构造函数?

    • 1 个回答
  • Marko Smith

    std::common_reference_with 在元组上的行为不一致。哪个是对的?

    • 1 个回答
  • Marko Smith

    C++17 中 std::byte 只能按位运算?

    • 1 个回答
  • Martin Hope
    fbrereto 为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 您可以使用花括号初始化列表作为(默认)模板参数吗? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi 为什么列表推导式在内部创建一个函数? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A fmt 格式 %H:%M:%S 不带小数 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python C++20 的 std::views::filter 未正确过滤视图 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute 为什么 'char -> int' 是提升,而 'char -> Short' 是转换(但不是提升)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa 为什么库中不调用全局变量的构造函数? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis std::common_reference_with 在元组上的行为不一致。哪个是对的? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev 为什么编译器在这里错过矢量化? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan C++17 中 std::byte 只能按位运算? 2023-08-17 17:13:58 +0800 CST

热门标签

python javascript c++ c# java typescript sql reactjs html

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve