公开的实际问题:
我使用一个名为 youtube-dl 的程序从 YouTube 和 Twitch 等网站下载和存档视频。为了验证下载的完整性,我下载了两次相同的视频并验证它们的校验和是否匹配。我担心一些未被注意到的问题可能会导致两个视频以相同的方式被静默损坏,即使它们的数据完整性已受到损害,也会导致匹配校验和。
最初发布的问题:
特定数据损坏是否可以重现到其产生的哈希值?
例如,如果某个文件在执行后由于某些底层软件或硬件问题而发生数据损坏,那么该文件的副本在类似执行后是否会遇到完全相同的数据损坏方式,从而导致哈希值与原始损坏的文件?
换句话说,所有数据损坏是否都必须以某种方式唯一,或者某些损坏是否可以一致并准确复制?