我是机器学习领域的新手。我正在尝试实现文章“使用智能手表和深度学习进行游泳风格识别和圈数计数”( https://doi.org/10.1145/3341163.3347719 )中的模型。模型的输入由 11 个通道的窗口数据组成,大小为 180。但是在第一个卷积层和最大池化之后,它们的张量由 11 层组成,窗口大小等于 59,但还有另一个维度,有 64 个特征图。但作者仅使用了内核大小为 3x1 的 conv1d。
我无法使用 nn.Conv1d 实现这样的内核。我怎样才能做到这一点?
我是机器学习领域的新手。我正在尝试实现文章“使用智能手表和深度学习进行游泳风格识别和圈数计数”( https://doi.org/10.1145/3341163.3347719 )中的模型。模型的输入由 11 个通道的窗口数据组成,大小为 180。但是在第一个卷积层和最大池化之后,它们的张量由 11 层组成,窗口大小等于 59,但还有另一个维度,有 64 个特征图。但作者仅使用了内核大小为 3x1 的 conv1d。
我无法使用 nn.Conv1d 实现这样的内核。我怎样才能做到这一点?
具有内核大小的卷积
3x1
不是 1D 卷积,而是 2D 卷积:看一下单通道
180x11
输入的推论:这与上图中所示的“Conv.layer 1”输出的形状相匹配。