虽然与这个问题有关,但我从一个稍微不同的角度来处理这个问题。这是我的情况:
我正在编写一个 Web 应用程序(使用 PHP 或 Python)来管理桌面应用程序的插件。用户可以浏览插件、安装插件、上传插件等。
我正在为数据库规划架构,发现自己做出以下决定:
将图标(用于插件)存储在表本身中还是将它们存储在文件系统中并仅将文件名存储在表中更好?
这些图标很小(48x48 或接近 48x48),最多可能不会超过 5 或 6 KB。将图像数据存储在表格中有什么严重的缺点吗?还有其他我应该注意的含义吗?性能会成为问题吗?存储会成为问题吗?
编辑:我目前正在查看 MySQL 数据库中的 MyISAM 表。
您尚未指定您考虑的数据库平台,但在这种规模/规模下,它不太可能重要。
每条记录 5kb 是微不足道的。100 万条 5kb 的记录小于 5GB,仍然微不足道。1000 万条 5kb 的记录......仍然不是让你失眠的事情。
如果我们要获得特定于平台的信息,Paul Randall 对 SQL Server 文件流存储的典型详尽研究白皮书表明,它优于文件大小为 1MB 或更大的表存储。低于 1MB 的文件大小,积极的方面主要是绕过缓冲池的文件流。
数据库存储的优点:
编辑:底片(如亚伦所建议)
使存储图像数据相当具有挑战性的另一个有趣的方面是具有正确的数据包大小。我在 2011 年 4 月 27 日回复了这个问题。
由于图像要存储在 BLOB 字段中,BLOB 数据将通过程序(如 mysqldump)、基础设施(如 MySQL Replication)和一般查询使用(如将 BLOB 数据存储在JOIN 和 WHERE 子句逃避期间的内部临时表)。
另外,正如前面URL中提到的,InnoDB存储引擎有一种在内存和日志文件中处理数据包的方法。
不容忽视的是构建 SQL 查询
鉴于这些事实,您必须为 my.cnf 配置max_allowed_packet的数字,以便单个 MySQL 数据包足够大以容纳多个 BLOB。您还必须考虑在数据库服务器上是否有足够的可用 RAM。否则,通过不断将单个 BLOB 移入和移出数据包来批量处理 BLOB 会产生意想不到的性能瓶颈。
结论
一旦您有足够的可用 RAM、适当大小的 MySQL 数据包和避免在多个临时表中堆积 BLOB 数据的查询,大多数注意事项/缺点应该相互抵消。
更新 2011-09-09 12:23 EDT
另一个考虑是记住在 mysqldump 中使用 --hex-blob 选项。否则,根据某些字符序列重新加载 blob 可能会有些困难。