如何将 for 循环拆分为 3 个单独的数据框？

Question

simon

Asked: 2024-08-07 16:29:45 +0800 CST2024-08-07 16:29:45 +0800 CST 2024-08-07 16:29:45 +0800 CST

从 DICOM 文件导出的 MPEG-4 视频中的 16 字节偏移量

772

简短版本Pydicom：通过以下代码从 DICOM 文件导出 MPEG-4 视频流时，16 字节偏移量来自哪里？（另外，附加问题是，它始终是 16 字节偏移量吗？）

from pathlib import Path
import pydicom

in_dcm_filename: str = ...
out_mp4_filename: str = ...

ds = pydicom.dcmread(in_dcm_filename)
Path(out_mp4_filename).write_bytes(ds.PixelData[16:])  # 16-byte offset necessary

为了可重复性，可以使用我在Google 群组的旧讨论中找到的这个 DICOM 文件（内容警告：该视频展示了神经外科干预中的开放大脑）。

长版本

我有许多包含手术 MPEG-4 视频流的 DICOM 文件（传输语法 UID 1.2.840.10008.1.2.4.102 – MPEG-4 AVC/H.264 High Profile / Level 4.1）。我想从 DICOM 文件中导出视频流，以便在下游任务中更轻松地处理。

经过一番谷歌搜索后，我发现了以下讨论，建议使用dcmdumpfrom DCMTK，如下所示（我能够重现）：

跑步dcmdump +P 7fe0,0010 <in_dcm_filename> +W <out_folder>。
从得到的两个文件中<out_folder>，mpeg4.dcm.0.raw和mpeg4.dcm.1.raw，丢弃第一个文件（大小为 0 字节），保留第二个文件（可能将其后缀更改为.mp4），它是一个常规的可播放视频文件。

从命令中看到的内容dcmdump，我得出结论，这只是标签7fe0,0010（即像素数据属性）的原始转储，因此我认为我可以使用重现此情况Pydicom。我第一次尝试使用Path(out_mp4_filename).write_bytes(ds.PixelData)（有关完整详细信息，请参阅上面的代码示例）；但是，我最终得到的是一个无法播放的文件。然后，我比较了结果的十六进制转储dcmdump和结果Pydicom：

$ hd ./dcmdump.mp4 | head
00000000  00 00 00 20 66 74 79 70  69 73 6f 6d 00 00 02 00  |... ftypisom....|
00000010  69 73 6f 6d 69 73 6f 32  61 76 63 31 6d 70 34 31  |isomiso2avc1mp41|
00000020  00 00 00 08 66 72 65 65  00 ce 97 1d 6d 64 61 74  |....free....mdat|
...
$ hd ./pydicom.mp4 | head
00000000  fe ff 00 e0 00 00 00 00  fe ff 00 e0 3e bc ce 00  |............>...|
00000010  00 00 00 20 66 74 79 70  69 73 6f 6d 00 00 02 00  |... ftypisom....|
00000020  69 73 6f 6d 69 73 6f 32  61 76 63 31 6d 70 34 31  |isomiso2avc1mp41|
...

从这里我注意到我的Pydicom导出包含 16 个额外的前导字节。一旦我通过删除它们Path(out_mp4_filename).write_bytes(ds.PixelData[16:])，我就可以得到与完全相同的可播放视频导出dcmdump。

因此，我的问题是：这 16 个额外的字节来自哪里，它们的含义是什么，我是否可以安全地删除它们？

1 个回答

Voted

MrBean Bremen · Answer 1 · 2024-08-07T19:29:53+08:00

您之所以看到这些字节，是因为像素数据被封装了。使用dcmdump可以清楚地显示这一点：

(7fe0,0010) OB (PixelSequence #=2)                      # u/l, 1 PixelData
  (fffe,e000) pi (no value available)                     #   0, 1 Item
  (fffe,e000) pi 00\00\00\20\66\74\79\70\69\73\6f\6d\00\00\02\00\69\73\6f\6d\69\73... # 13548606, 1 Item
(fffe,e0dd) na (SequenceDelimitationItem)               #   0, 0 SequenceDelimitationItem

如果您检查剥离的前导字节，您会发现它们包含相应的分隔符标记，如转储输出中所示。您还可以看到其中包含 2 个项目，其中第一个是空的 - 这些是您使用 dcmtk 获得的。

要获取封装的内容，您可以encaps.defragment_data在 pydicom 2.x 中使用，它会返回一个数据块中包含的所有片段（在 pydicom 3 中，接口将更改为一次产生一个片段）：

    from pydicom import dcmread, encaps

    ds = dcmread"test_720.dcm")
    with open("test_720.mpeg4", "wb") as f:
        f.write(encaps.defragment_data(ds.PixelData))

请注意，通常情况下，片段是多帧数据的一部分（最常见的情况是每帧一个片段），您可能需要单独处理它们。在 MPEG4 的情况下，只有一个包含视频数据的连续数据流，合并可能被分割成的任何片段是处理这种情况的正确方法。

从 DICOM 文件导出的 MPEG-4 视频中的 16 字节偏移量

长版本

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

从 DICOM 文件导出的 MPEG-4 视频中的 16 字节偏移量

长版本

1 个回答

相关问题