在 SQLite 上写入一行需要多少次磁盘寻道？

Question

Asked: 2023-02-27 05:33:19 +0800 CST2023-02-27 05:33:19 +0800 CST 2023-02-27 05:33:19 +0800 CST

相同的数据存储在更多行中且重复次数更多导致 SQLITE 文件更小？

772

我正在比较两个非常准系统的 SQLite 数据库，其中相同的数据以不同的方式存储。

数据库 A 有这样的表：

字符串（唯一文本）	count_1（整数）	count_2（整数）
这	23	10
它	56	44
曾是	32	89

数据库 B 有这样的表：

字符串（文本）	count_1（整数）	count_2（整数）
这	23	`null`
这	`null`	10
它	56	`null`
它	`null`	44
曾是	32	`null`
曾是	`null`	89

奇怪的是，在两者之后，数据库 A 占用的磁盘空间比数据库 B多近 50%（4.8MB 对 2.5MB）VACUUM。这违背了我的预期，因为数据库 B 有双倍的行并且必须重复每个字符串值两次。我想知道是否对此有任何解释，或者我是否只是以某种方式错误地生成了表格。如果我在这里遗漏了一些非常基本的东西，我深表歉意——我是 RDB 的新手。

更新：我现在确定数据库 A 中字符串列的 UNIQUE 约束是导致大小加倍的原因——我很好奇为什么会这样！

Andrea B. · Answer 1 · 2023-02-27T20:58:50+08:00

添加 UNIQUE 约束会强制 SQLite 为数据库中的表创建唯一索引。

对于表中的每一行，索引都有一个字符串列的副本和对表中 ROWID 的引用（它是一个整数），因此它的大小与表的大小相当。

SQLite 在存储值方面非常高效，因此数据库 B 中的 NULL 不会占用不必要的空间，并且使用 varint 存储 INTEGERS，其长度取决于存储的值。

count_1 和 count_2 具有可以存储在单个字节中的低值。唯一索引中的 ROWID 可以占用 2,3 或更多字节（如果有数百万行），因此索引中的 string+ROWID 可以比表中的 string+NULL+byte 占用更多的空间。

相同的数据存储在更多行中且重复次数更多导致 SQLITE 文件更小？

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

相同的数据存储在更多行中且重复次数更多导致 SQLITE 文件更小？

1 个回答

相关问题