我有一些包含 HDMV PGS 字幕的视频文件,我需要将它们转换为 subrip(或其他文本字幕)。我知道我可以对视频文件进行 ffmpeg 解复用以提取.sup
并即时将其转换为 VobSub,然后subtitleedit /convert
使用它自己的 tesseract 进行 subrip。
但是,我只想使用 ffprobe/ffmpeg,我之前用 libtesseract 和 all 编译过。我也不介意将原始 tesseract 输出解析为 subrip,但我只需要得到它。
我试过例如:
ffprobe -show_entries frame_tags=lavfi.ocr.text -f lavfi -i "movie=pgs.mkv,ocr"
自然,它会尝试读取视频流而不是字幕流之一。将它瞄准一个.sup
文件或多个子.mks
或多个.sub/idx
文件会让我No video stream with index '-1' found
出错,这在技术上是正确的,但是......
有没有办法让 ffprobe/ffmpeg OCR 成为实际的字幕而不是视频?