Eu tenho uma tabela User Relations, que basicamente armazena todas as relações unidirecionais dos usuários. Por exemplo, o usuário A segue o usuário B; O usuário X bloqueia o usuário Y
Códigos de usuário:
o id dos usuários são bigints . Não é como se eu achasse que usar ints realmente acabaria em um gargalo (a menos que meu aplicativo cresça para mais de 2 bilhões de usuários :)), mas até onde eu entendo, se eu integrar inscrições de redes sociais, o Facebook usa bigints para seus ids de usuário, portanto, tenho que manter o id dos usuários como bigint.
Indexação :
A princÃpio pensei em fazer um Ãndice composto de ambos os usuários (o relacionado e o relacionado), mas como ambos os Ãndices são bigints, ou seja, 8 bytes cada, não seria um desperdÃcio armazenar um Ãndice tão monstruoso? Acabei deixando apenas um Ãndice de coluna, mas não tenho certeza se é a decisão mais sábia neste caso.
Eu também pensei em uma variante com Ãndice de cobertura - mas neste caso o tipo_relação(follow, block) não fará parte da indexação/filtragem, então talvez eu deva incluir isso dentro do Ãndice composto, mas então eu teria 8+8+ 4 bytes de Ãndice. As compensações entre espaço e tempo não são claras para mim neste caso. Agradeceria qualquer opinião sobre o assunto.
Primeira variante (Ãndice de uma coluna):
CREATE TABLE user_relations (
relating_user_id bigint NOT NULL,
related_user_id bigint NOT NULL,
relation_type smallint NOT NULL,
created_at default current_timestamp,
PRIMARY KEY (relating_user_id),
FOREIGN KEY (relation_type) references user_relations_types (id)
-- will having only one index affect the performance really ?
-- should I include the type into the composite type ?
);
Segunda variante (usando Ãndice de cobertura e omitindo PK):
CREATE TABLE user_relations (
relating_user_id bigint NOT NULL,
related_user_id bigint NOT NULL,
relation_type smallint NOT NULL,
created_at default current_timestamp,
FOREIGN KEY (relation_type) references user_relations_types (id),
CREATE UNIQUE INDEX relating_user_related_user_relation_type_idx ON user_relations
(relating_user_id, related_user_id) INCLUDE (relation_type);
-- should I include the type into the composite type ?
);
Os Ãndices usam espaço e uma chave de 16 bytes não é nada para se preocupar.
Portanto, você deve definir a chave primária em
user_relations
on(relating_user_id, related_user_id)
. Se você precisar pesquisar porrelation_type
, não ajudará colocar a coluna naINCLUDE
lista, pois essas colunas não podem ser usadas como filtro para uma verificação de Ãndice.Vejo duas opções:
Além da chave primária sugerida acima, tenha Ãndices adicionais em
(relating_user_id, relation_type)
e(related_user_id, relation_type)
.Se você quiser ter menos Ãndices, defina a chave primária
(relating_user_id, relation_type, related_user_id)
e defina apenas um Ãndice adicional. Talvez você possa conviver com isso se o banco de dados permitir vários relacionamentos diferentes entre os mesmos usuários.O fator decisivo sobre quais Ãndices definir devem ser as consultas que você terá que atender com frequência e eficiência. Projete essas consultas e a questão se tornará mais fácil.