Eu tenho um processo de importação que é executado de vez em quando e quero que seja um tipo de negócio 'tudo ou nada', também conhecido como: uma transação.
Existem muitos aspectos, e as importações podem render entre 100k-1mil+ registros. Isso equivale a uma carga útil que varia de vários MB a algumas centenas de MB de dados.
Eu sei que as tabelas temporárias são outra opção - mas esse método parece tão útil.
Existem algumas ressalvas a serem observadas em relação a esse tipo de prática com uma grande quantidade de manipulação de dados entre os commits? (Fora da explosão de carga de gravação/indexação típica uma vez confirmada)
Um gargalo a ser observado é o InnoDB Log Buffer. O tamanho é definido por innodb_log_buffer_size . Aqui está o que a documentação do MySQL diz sobre isso:
O InnoDB Log Buffer não deve ser confundido com o InnoDB Buffer Pool. A principal diferença entre eles é o seu propósito. O InnoDB Log Buffer basicamente registrará alterações de curto prazo que são gravadas nos logs de redo (ib_logfile0, ib_logfile1). O InnoDB Buffer Pool (dimensionado por innodb_buffer_pool_size ) armazena dados e páginas de índice que devem ser confirmadas (se as páginas estiverem sujas) e eventualmente gravadas) no disco. Depois de confirmadas, as páginas de alterações permanecem na RAM até serem removidas por meio de regras LRU.
Grandes transações devem passar pelo Log Buffer. Conforme mencionado, um buffer de log maior reduzirá a E/S do disco. Apenas um commit grande apresentaria um gargalo.
Você pode querer olhar para outras opções do InnoDB para configurar.
Eu tenho outros posts sobre como otimizar o InnoDB para pesquisas adicionais