我的公司从一开始就被束缚在这种 MS Access '97 .MDB 格式上。我们的模式是分层的,具有多个一对多的关系。我们正处于寻找替代方案的地步,因为 Access 的缓慢和整体笨拙开始影响我们的生产力。
我们访问数据库的“现代”方法涉及 DAO.Net 和大量基于哈希的缓存。.NET System.Collections.Generic.Dictionary 类型在这里是天赐之物,因为没有它,我不知道我们将如何及时完成工作。我们有多个项目,每个项目都有一个与之关联的数据库文件(有时是多个),我们倾向于通过以下两种方式之一进行交互:要么手动创建数据库(使用我们的内部编辑器),要么使用程序生成它以其他格式获取我们从另一家公司收到的数据,并将其转换为我们的格式。
在这两种情况下,我们的通用 .NET 库通过 Dictionary 将整个数据库加载到哈希表中,并通过在哈希表中按 ID 查找值来解析对象与代码的关系。在自动生成数据库时,我们使用另一组哈希表来确定一个对象在添加之前是否已经存在于缓存中。一旦我们完成了源数据的解析,我们就开始一个多线程的批量插入操作。我们这样做是因为任何其他访问数据库的方法都非常慢。
我希望我已经为我的问题提供了足够的背景信息:是否有一个数据库引擎,其查询速度可以与我正在使用的哈希表相媲美?内存和磁盘使用无关紧要,这些数据库仅存在于开发人员机器上,我们将它们转换为不同的格式以与我们的软件一起使用。我只想摆脱我的哈希表,但我不想牺牲速度来做到这一点。
“有没有数据库引擎,其查询速度可以与我使用的哈希表相媲美? ” - 是的,几乎所有现代关系数据库管理系统 (RDBMS),因为它们经过精心构建以利用适当的数据给定数据的上下文和统计数据的结构和数据合并算法。始终使用哈希表、字典和多个单例 ID 查找并不总是存储、读取和组合数据的最有效方式。
我个人的看法是 MS Access 作为一个数据库系统很糟糕,更何况你使用的是 '97 版本。因此,几乎所有现代 RDBMS 都应该是升级版。您可能只需要将范例转换为将数据库存储在专用服务器上,而不是本地存储在客户端机器上,因为这是现代 RDBMS 的标准做法。
有很多选项可供选择,但我建议选择一个主流选项,以便有大量关于如何使用它的支持和文档。由于您已经在使用他们的堆栈,Microsoft 提供 SQL Server 作为解决方案,它功能强大且设计精良,但它是一种企业软件,因此使用起来可能需要花钱。SQL Server 的 Express Edition 是免费的,但有几个限制,最明显的限制是每个数据库大小为 10 GB。其他便宜且免费的选项还包括 PostgreSQL 和 MySQL。
切换到现代 RDBMS 的另一个显着好处可能包括改进的并发性。