我正在努力为我的数据结构优化正确的索引创建。我正在尝试索引大量 json 数据类型的数据(~100B 记录):
{
"email": "[email protected]",
"first_domain": "q.w.e.r.t.y.com"
"second_domain": "a.s.d.f.g.h.j.com"
}
简单的查询可能看起来像
SELECT *
from table
WHERE email = '[email protected]'
或者
SELECT *
from table
WHERE first_domain LIKE '%.r.t.y.com'
OR second_domain LIKE '%.r.t.y.com'
以前我会将所有域标记化并将它们放在 mongo 中的数组中
{
"values": ["[email protected]", "moc.y.t.r.e.w.q", moc.j.h.g.f.d.s.a]
}
但是拥有 amount I 数据的 Mongo 无法将所有值存储在内存中并且写入性能会降低。
所以我打算试试 Postgres 和 GIN 索引。请建议我为这种情况创建适当的索引。