AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 78842605
Accepted
simon
simon
Asked: 2024-08-07 16:29:45 +0800 CST2024-08-07 16:29:45 +0800 CST 2024-08-07 16:29:45 +0800 CST

Deslocamento de 16 bytes na exportação de vídeo MPEG-4 do arquivo DICOM

  • 772

Versão curta : De onde vem o deslocamento de 16 bytes ao exportar um fluxo de vídeo MPEG-4 de um arquivo DICOM por Pydicommeio do código a seguir? (E, pergunta bônus, é sempre um deslocamento de 16 bytes?)

from pathlib import Path
import pydicom

in_dcm_filename: str = ...
out_mp4_filename: str = ...

ds = pydicom.dcmread(in_dcm_filename)
Path(out_mp4_filename).write_bytes(ds.PixelData[16:])  # 16-byte offset necessary

Para reprodutibilidade, pode-se usar, por exemplo, este arquivo DICOM que encontrei nesta antiga discussão nos Grupos do Google (aviso de conteúdo: o vídeo mostra o cérebro aberto em uma intervenção neurocirúrgica).

Versão longa

Eu tenho vários arquivos DICOM contendo fluxos de vídeo cirúrgicos MPEG-4 (sintaxe de transferência UID 1.2.840.10008.1.2.4.102 – MPEG-4 AVC/H.264 High Profile / Level 4.1 ). Eu queria exportar os fluxos de vídeo dos arquivos DICOM para facilitar o manuseio em tarefas posteriores.

Depois de pesquisar um pouco no Google, encontrei a seguinte discussão , sugerindo o uso de dcmdumpfrom DCMTK, da seguinte maneira (que consegui reproduzir):

  • Correr dcmdump +P 7fe0,0010 <in_dcm_filename> +W <out_folder>.
  • Dos dois arquivos resultantes em <out_folder>, mpeg4.dcm.0.rawe mpeg4.dcm.1.raw, descarte o primeiro, que tem tamanho de 0 bytes, e mantenha o segundo (potencialmente alterando seu sufixo para .mp4), que é um arquivo de vídeo normal e reproduzível.

Pelo que vi no dcmdumpcomando, concluí que era apenas um despejo bruto de tag 7fe0,0010(que é o atributo Pixel Data ), então pensei em reproduzir isso com Pydicom. Minha primeira tentativa foi usar Path(out_mp4_filename).write_bytes(ds.PixelData)(veja o exemplo de código acima para detalhes completos); no entanto, acabei com um arquivo que não pôde ser reproduzido. Em seguida, comparei um despejo hexadecimal do dcmdumpresultado e do Pydicomresultado:

$ hd ./dcmdump.mp4 | head
00000000  00 00 00 20 66 74 79 70  69 73 6f 6d 00 00 02 00  |... ftypisom....|
00000010  69 73 6f 6d 69 73 6f 32  61 76 63 31 6d 70 34 31  |isomiso2avc1mp41|
00000020  00 00 00 08 66 72 65 65  00 ce 97 1d 6d 64 61 74  |....free....mdat|
...
$ hd ./pydicom.mp4 | head
00000000  fe ff 00 e0 00 00 00 00  fe ff 00 e0 3e bc ce 00  |............>...|
00000010  00 00 00 20 66 74 79 70  69 73 6f 6d 00 00 02 00  |... ftypisom....|
00000020  69 73 6f 6d 69 73 6f 32  61 76 63 31 6d 70 34 31  |isomiso2avc1mp41|
...

A partir disso, percebi que minha Pydicomexportação continha 16 bytes extras anteriores. Depois de removê-los por meio do Path(out_mp4_filename).write_bytes(ds.PixelData[16:]), obtive exatamente a mesma exportação de vídeo reproduzível que o dcmdump.

Então, novamente, minha pergunta é: de onde vêm esses 16 bytes extras, qual é o seu significado e estou seguro simplesmente removê-los?

python
  • 1 1 respostas
  • 58 Views

1 respostas

  • Voted
  1. Best Answer
    MrBean Bremen
    2024-08-07T19:29:53+08:002024-08-07T19:29:53+08:00

    A razão pela qual você vê esses bytes é que os dados do pixel são encapsulados . O uso do dcmdump mostra isso claramente:

    (7fe0,0010) OB (PixelSequence #=2)                      # u/l, 1 PixelData
      (fffe,e000) pi (no value available)                     #   0, 1 Item
      (fffe,e000) pi 00\00\00\20\66\74\79\70\69\73\6f\6d\00\00\02\00\69\73\6f\6d\69\73... # 13548606, 1 Item
    (fffe,e0dd) na (SequenceDelimitationItem)               #   0, 0 SequenceDelimitationItem
    

    Se você verificar os bytes iniciais removidos, poderá ver que eles contêm as respectivas tags delimitadoras, conforme mostrado na saída do dump. Você também pode ver que há 2 itens contidos, o primeiro deles vazio - esses são os que você obtém usando o dcmtk.

    Para obter o conteúdo encapsulado, você pode usar encaps.defragment_datano pydicom 2.x, que retorna todos os fragmentos contidos em um bloco de dados (no pydicom 3, a interface mudará para produzir um fragmento por vez):

        from pydicom import dcmread, encaps
    
        ds = dcmread"test_720.dcm")
        with open("test_720.mpeg4", "wb") as f:
            f.write(encaps.defragment_data(ds.PixelData))
    

    Observe que, em geral, os fragmentos são partes de dados multiquadro (no caso mais comum, um fragmento por quadro) e você pode querer tratá-los separadamente. No caso do MPEG4, há apenas um fluxo de dados contínuo com os dados de vídeo, e a fusão de quaisquer fragmentos em que este possa ser dividido é a maneira correta de lidar com isso.

    • 2

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Quando devo usar um std::inplace_vector em vez de um std::vector?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Martin Hope
    Aleksandr Dubinsky Por que a correspondência de padrões com o switch no InetAddress falha com 'não cobre todos os valores de entrada possíveis'? 2024-12-23 06:56:21 +0800 CST
  • Martin Hope
    Phillip Borge Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle? 2024-12-12 20:46:46 +0800 CST
  • Martin Hope
    Oodini Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores? 2024-12-12 06:27:11 +0800 CST
  • Martin Hope
    sleeptightAnsiC `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso? 2024-11-09 07:18:53 +0800 CST
  • Martin Hope
    The Mad Gamer Quando devo usar um std::inplace_vector em vez de um std::vector? 2024-10-29 23:01:00 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST
  • Martin Hope
    MarkB Por que o GCC gera código que executa condicionalmente uma implementação SIMD? 2024-02-17 06:17:14 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve