我有一张products
包含近500 万条记录的表。
我有一个产品类别的专栏(product_category)
。它现在是类型INT(11)
,它是一个索引并且引用另一个表(categories
表)类别表只包含类别的名称。
类别名称是静态的,从不更新或编辑。
在最快的查询中始终获得产品类别名称的最佳解决方案是什么?
- 使用连接方法。
- 使用子查询方法。
- 将类别名称作为 a存储
string
在 products 表中。
如果有任何其他建议会很好,那么上述选项的最佳最佳解决方案是什么?
当然,将数据存储在单个表中几乎总是将数据具体化以供读取的“最快”方式。但是在数据库系统中,当您对数据进行非规范化时,您会遇到数据维护和准确性方面的问题。当同时从表中写入和读取数据时,您甚至可能会遇到阻碍数据库性能的问题。
例如,假设您想
categories
在应用程序中显示唯一的列表。好吧,您必须运行一个查询SELECT DISTINCT CategoryName FROM products
才能这样做,可能会扫描整个 500 万行表。对性能来说不是很好。如果有一天一组products
更改以某种方式使它们更适合成为不同的一部分category
呢?...更新这些记录将锁定表和/或被锁定等待上述查询完成,只要应用程序被跑了。同样,在性能方面不是很好。还有许多其他原因,您也应该规范化您的数据。将不同的列表存储
categories
到它自己的表中可能对整体性能、数据准确性和管理是最好的。500 万行实际上并不是一张大表,当索引适当时JOIN
,使用像这样的小表categories
会非常快(可能与将所有内容存储在单个表中的情况不同几毫秒)。此外,如果您并不总是products
从数据库系统中读取全部 500 万条数据,而是一次读取一个子集,那么products
表的大小并不重要(再次正确索引时)。