为什么 InetAddress 上的 switch 模式匹配会失败，并出现“未涵盖所有可能的输入值”？

Question

Ian Boyd

Asked: 2024-01-19 02:07:40 +0800 CST2024-01-19 02:07:40 +0800 CST 2024-01-19 02:07:40 +0800 CST

Flatten() 的 input_shape 参数是什么意思？

772

我正在关注 Tensorflow 初学者教程：

https://www.tensorflow.org/tutorials/quickstart/beginner

我们来到第一行代码：

构建机器学习模型

构建 tf.keras.Sequential 模型：

model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])

我对第一行感到困惑：

tf.keras.layers.Flatten(input_shape=(28, 28))

具体来说就是input_shape论点。

为什么：因为我认为该Flatten操作采用前一层并将其转换为一维向量；那么这个input_shape论证是什么意思呢？

所以我们查阅文档

文档Flatten()： https: //www.tensorflow.org/api_docs/python/tf/keras/layers/Flatten

说：

压平输入。不影响批量大小。

具体来说，我对这个input_shape论点感兴趣：

参数

data_format一个字符串，channels_last（默认）或之一channels_first。输入中维度的顺序。Channels_last 对应于形状 ( batch, ..., channels) 的输入，而 Channels_first 对应于形状 ( batch, channels, ...) 的输入。如果未指定，则使用image_data_formatKeras 配置文件中~/.keras/keras.json（如果存在）“channels_last”处找到的值。默认为“channels_last”。

没有名为的参数input_shape。

那么这个论证的意义是什么？

简洁版本

如果我从文档中编写 TF 代码，我怎么知道它Flatten需要一个input_shape参数？
为什么input_shape文档中省略了该参数？

换句话说：文档假定您具备一些有关 TensorFlow 的基本知识，但文档本身并未对此进行说明。

有人可以帮助我理解这种无证行为，以及为什么它没有记录？

研究工作

除了查阅文档之外，我们还有：

Keras 输入解释：input_shape、units、batch_size、dim 等（不是我的问题，也不是回答我的问题）

1 个回答

Voted

Jafar Isbarov · Answer 1 · 2024-01-19T02:22:23+08:00

Best Answer

Jafar Isbarov

2024-01-19T02:22:23+08:002024-01-19T02:22:23+08:00

input_shape是一个可选参数，可以添加到FlattenKeras 模型的第一层（或不添加）。Keras 使用它的值隐式创建一个InputLayer。

您的模型相当于：

model = tf.keras.models.Sequential([
  tf.keras.layers.InputLayer(input_shape=(28, 28)),
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])

引用文档：

当与 Keras Sequential 模型一起使用时InputLayer，可以通过将input_shape参数移动到InputLayer.

1

Flatten() 的 input_shape 参数是什么意思？

构建机器学习模型

所以我们查阅文档

简洁版本

研究工作

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

Flatten() 的 input_shape 参数是什么意思？

构建机器学习模型

所以我们查阅文档

简洁版本

研究工作

1 个回答

相关问题