Atualizando todas as linhas, exceto uma que tenha os mesmos valores em determinadas colunas

Question

Luke Vo

Asked: 2025-03-22 10:44:03 +0800 CST2025-03-22 10:44:03 +0800 CST 2025-03-22 10:44:03 +0800 CST

Índice composto na tabela Log do banco de dados: (Status, CreatedTime) ou (CreatedTime, Status)?

772

Geralmente uso uma chave composta (CreatedTime, Status)para minha Logtabela, mas estou reconsiderando esse design. Como CreatedTimeé tipicamente muito única e Statustem apenas 3-5 valores possíveis, parece que isso Statuspode não adicionar muito à filtragem posterior CreatedTime.

A maioria das minhas consultas envolve recuperar logs para um intervalo de tempo específico, opcionalmente filtrando ou contando por Status. Conceitualmente, se eu estivesse trabalhando com um livro de registro físico classificado por tempo, identificar entradas com um específico Status(por exemplo, "Bem-sucedido") seria trabalhoso. Por outro lado, ter livros de registro separados para cada Status, todos classificados por tempo, poderia tornar a pesquisa mais eficiente — embora combinar e reclassificar resultados para todos Statusos valores possa complicar as coisas. O banco de dados otimiza para tais cenários?

Já perguntei a três IAs diferentes sobre isso, mas suas respostas foram vagas e contraditórias (e até mesmo a mesma IA dá respostas diferentes apenas perguntando de forma ligeiramente diferente), e não consigo encontrar muita coisa no Google e no SO. Alguém pode confirmar se minha intuição aqui está correta?

2 respostas

Voted

D Stanley · Answer 1 · 2025-03-22T11:03:10+08:00

Seus índices devem ser baseados em como você normalmente consulta seus dados. Como você normalmente consulta logs para um determinado intervalo de datas, então um índice em CreatedTimeseria mais eficiente. Duvido que o kay on secundário Statusfaça uma diferença significativa, a menos que você consulte um número muito grande de logs sem seu intervalo de datas, apenas alguns correspondem ao status que você deseja. Além disso, como você provavelmente não tem vários logs de status diferentes exatamente ao mesmo tempo, o subíndice não está ajudando, pois ele terá que escanear todos os registros de índice para o período de tempo fornecido de qualquer maneira.

A indexação Status, CreatedTimenão será significativamente mais rápida do que CreatedDate, Statusse você quisesse logs de um status, e terá menos desempenho se você forçar o mecanismo a escanear vários status e consolidar os resultados.

De importância secundária é como os dados são adicionados . Como você quase certamente adiciona logs sequencialmente, a indexação por Status, CreatedTimeserá menos eficiente, pois você estará inserindo registros no meio com bastante frequência, dificultando a adição de registros. A indexação por CreatedTimesignifica que você quase sempre estará adicionando registros ao final da sua tabela, exceto atividades incomuns, como importações em massa de logs mais antigos.

Tometzky · Answer 2 · 2025-03-24T15:35:46+08:00

Tometzky

2025-03-24T15:35:46+08:002025-03-24T15:35:46+08:00

Eu recomendaria 2 índices:

CreatedTime
Status, CreatedTime where Status != 'OK' - um índice parcial

Você gostaria de consultar todos os logs por algum período de tempo e também, por exemplo, todas as entradas com Status=Errorpor algum período de tempo. Esses 2 índices ajudarão você com ambos. Como a vasta maioria das entradas de log provavelmente terá OKstatus (ou equivalente), então o segundo índice será muito menor.

Armazenar logs em um banco de dados geralmente não é muito econômico. Pode causar longos tempos de backup e restauração, aumentos repentinos de uso de armazenamento causando erros de falta de espaço de armazenamento, picos de uso de IO não planejados enquanto ele é aspirado e outros problemas potenciais.

1

Índice composto na tabela Log do banco de dados: (Status, CreatedTime) ou (CreatedTime, Status)?

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Índice composto na tabela Log do banco de dados: (Status, CreatedTime) ou (CreatedTime, Status)?

2 respostas

relate perguntas