AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / coding / 问题 / 78842605
Accepted
simon
simon
Asked: 2024-08-07 16:29:45 +0800 CST2024-08-07 16:29:45 +0800 CST 2024-08-07 16:29:45 +0800 CST

从 DICOM 文件导出的 MPEG-4 视频中的 16 字节偏移量

  • 772

简短版本Pydicom:通过以下代码从 DICOM 文件导出 MPEG-4 视频流时,16 字节偏移量来自哪里?(另外,附加问题是,它始终是 16 字节偏移量吗?)

from pathlib import Path
import pydicom

in_dcm_filename: str = ...
out_mp4_filename: str = ...

ds = pydicom.dcmread(in_dcm_filename)
Path(out_mp4_filename).write_bytes(ds.PixelData[16:])  # 16-byte offset necessary

为了可重复性,可以使用我在Google 群组的旧讨论中找到的这个 DICOM 文件(内容警告:该视频展示了神经外科干预中的开放大脑)。

长版本

我有许多包含手术 MPEG-4 视频流的 DICOM 文件(传输语法 UID 1.2.840.10008.1.2.4.102 – MPEG-4 AVC/H.264 High Profile / Level 4.1)。我想从 DICOM 文件中导出视频流,以便在下游任务中更轻松地处理。

经过一番谷歌搜索后,我发现了以下讨论,建议使用dcmdumpfrom DCMTK,如下所示(我能够重现):

  • 跑步dcmdump +P 7fe0,0010 <in_dcm_filename> +W <out_folder>。
  • 从得到的两个文件中<out_folder>,mpeg4.dcm.0.raw和mpeg4.dcm.1.raw,丢弃第一个文件(大小为 0 字节),保留第二个文件(可能将其后缀更改为.mp4),它是一个常规的可播放视频文件。

从命令中看到的内容dcmdump,我得出结论,这只是标签7fe0,0010(即像素数据属性)的原始转储,因此我认为我可以使用 重现此情况Pydicom。我第一次尝试使用Path(out_mp4_filename).write_bytes(ds.PixelData)(有关完整详细信息,请参阅上面的代码示例);但是,我最终得到的是一个无法播放的文件。然后,我比较了结果的十六进制转储dcmdump和结果Pydicom:

$ hd ./dcmdump.mp4 | head
00000000  00 00 00 20 66 74 79 70  69 73 6f 6d 00 00 02 00  |... ftypisom....|
00000010  69 73 6f 6d 69 73 6f 32  61 76 63 31 6d 70 34 31  |isomiso2avc1mp41|
00000020  00 00 00 08 66 72 65 65  00 ce 97 1d 6d 64 61 74  |....free....mdat|
...
$ hd ./pydicom.mp4 | head
00000000  fe ff 00 e0 00 00 00 00  fe ff 00 e0 3e bc ce 00  |............>...|
00000010  00 00 00 20 66 74 79 70  69 73 6f 6d 00 00 02 00  |... ftypisom....|
00000020  69 73 6f 6d 69 73 6f 32  61 76 63 31 6d 70 34 31  |isomiso2avc1mp41|
...

从这里我注意到我的Pydicom导出包含 16 个额外的前导字节。一旦我通过 删除它们Path(out_mp4_filename).write_bytes(ds.PixelData[16:]),我就可以得到与 完全相同的可播放视频导出dcmdump。

因此,我的问题是:这 16 个额外的字节来自哪里,它们的含义是什么,我是否可以安全地删除它们?

python
  • 1 1 个回答
  • 58 Views

1 个回答

  • Voted
  1. Best Answer
    MrBean Bremen
    2024-08-07T19:29:53+08:002024-08-07T19:29:53+08:00

    您之所以看到这些字节,是因为像素数据被封装了。使用dcmdump可以清楚地显示这一点:

    (7fe0,0010) OB (PixelSequence #=2)                      # u/l, 1 PixelData
      (fffe,e000) pi (no value available)                     #   0, 1 Item
      (fffe,e000) pi 00\00\00\20\66\74\79\70\69\73\6f\6d\00\00\02\00\69\73\6f\6d\69\73... # 13548606, 1 Item
    (fffe,e0dd) na (SequenceDelimitationItem)               #   0, 0 SequenceDelimitationItem
    

    如果您检查剥离的前导字节,您会发现它们包含相应的分隔符标记,如转储输出中所示。您还可以看到其中包含 2 个项目,其中第一个是空的 - 这些是您使用 dcmtk 获得的。

    要获取封装的内容,您可以encaps.defragment_data在 pydicom 2.x 中使用,它会返回一个数据块中包含的所有片段(在 pydicom 3 中,接口将更改为一次产生一个片段):

        from pydicom import dcmread, encaps
    
        ds = dcmread"test_720.dcm")
        with open("test_720.mpeg4", "wb") as f:
            f.write(encaps.defragment_data(ds.PixelData))
    

    请注意,通常情况下,片段是多帧数据的一部分(最常见的情况是每帧一个片段),您可能需要单独处理它们。在 MPEG4 的情况下,只有一个包含视频数据的连续数据流,合并可能被分割成的任何片段是处理这种情况的正确方法。

    • 2

相关问题

  • 如何将 for 循环拆分为 3 个单独的数据框?

  • 如何检查 Pandas DataFrame 中的所有浮点列是否近似相等或接近

  • “load_dataset”如何工作,因为它没有检测示例文件?

  • 为什么 pandas.eval() 字符串比较返回 False

  • Python tkinter/ ttkboostrap dateentry 在只读状态下不起作用

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    Vue 3:创建时出错“预期标识符但发现‘导入’”[重复]

    • 1 个回答
  • Marko Smith

    为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍,但在任何 Oracle JVM 上却不行?

    • 1 个回答
  • Marko Smith

    具有指定基础类型但没有枚举器的“枚举类”的用途是什么?

    • 1 个回答
  • Marko Smith

    如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误?

    • 6 个回答
  • Marko Smith

    `(表达式,左值) = 右值` 在 C 或 C++ 中是有效的赋值吗?为什么有些编译器会接受/拒绝它?

    • 3 个回答
  • Marko Smith

    何时应使用 std::inplace_vector 而不是 std::vector?

    • 3 个回答
  • Marko Smith

    在 C++ 中,一个不执行任何操作的空程序需要 204KB 的堆,但在 C 中则不需要

    • 1 个回答
  • Marko Smith

    PowerBI 目前与 BigQuery 不兼容:Simba 驱动程序与 Windows 更新有关

    • 2 个回答
  • Marko Smith

    AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String”

    • 1 个回答
  • Marko Smith

    我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

    • 1 个回答
  • Martin Hope
    Aleksandr Dubinsky 为什么 InetAddress 上的 switch 模式匹配会失败,并出现“未涵盖所有可能的输入值”? 2024-12-23 06:56:21 +0800 CST
  • Martin Hope
    Phillip Borge 为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍,但在任何 Oracle JVM 上却不行? 2024-12-12 20:46:46 +0800 CST
  • Martin Hope
    Oodini 具有指定基础类型但没有枚举器的“枚举类”的用途是什么? 2024-12-12 06:27:11 +0800 CST
  • Martin Hope
    sleeptightAnsiC `(表达式,左值) = 右值` 在 C 或 C++ 中是有效的赋值吗?为什么有些编译器会接受/拒绝它? 2024-11-09 07:18:53 +0800 CST
  • Martin Hope
    The Mad Gamer 何时应使用 std::inplace_vector 而不是 std::vector? 2024-10-29 23:01:00 +0800 CST
  • Martin Hope
    Chad Feller 在 5.2 版中,bash 条件语句中的 [[ .. ]] 中的分号现在是可选的吗? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench 为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng 为什么 `dict(id=1, **{'id': 2})` 有时会引发 `KeyError: 'id'` 而不是 TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String” 2024-03-20 03:12:31 +0800 CST
  • Martin Hope
    MarkB 为什么 GCC 生成有条件执行 SIMD 实现的代码? 2024-02-17 06:17:14 +0800 CST

热门标签

python javascript c++ c# java typescript sql reactjs html

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve