AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 3386
Accepted
Andrew Bickerton
Andrew Bickerton
Asked: 2011-06-21 02:09:49 +0800 CST2011-06-21 02:09:49 +0800 CST 2011-06-21 02:09:49 +0800 CST

Como o leitor de log processa atualizações em massa

  • 772

Problema-chave

A latência que estamos experimentando não está aplicando as alterações do Distribuidor aos Assinantes (se observarmos o Replication Monitor, a latência geralmente é <1 segundo), é o tempo que uma transação confirmada no banco de dados do publicador leva para chegar ao distribuidor .

Parte do problema é que temos vários filtros aplicados a uma de nossas tabelas mais voláteis e, a cada atualização/inserção/exclusão, o LogReader.exe precisa verificar em qual publicação colocar esse registro com base nos filtros aplicados.

Pelos testes que fizemos parece que cada filtro adicional aplicado pode aumentar exponencialmente o tempo que o LogReader leva para processar cada transação.

( editar 23/06/2011: adicionado mais detalhes sobre os filtros )

Fundo

Em nosso setup de Replicação temos diversas publicações com filtros em uma tabela altamente volátil (média de 1,5 milhões de transações em um período de 2h). Durante períodos pesados, isso pode resultar na execução do LogReader em uma latência de 20 segundos (geralmente < 1 segundo)

Identificamos várias áreas de melhoria (reduzindo o número de filtros, reduzindo o número de atualizações, eliminando o processamento etc.). Uma área potencial de melhoria é mudar a forma como as atualizações são aplicadas.

Uma tabela de exemplo (para ajudar na explicação)

myTable
----------------
myID         int
myGroupID1   int
myGroupID2   int
Suspended    bit
FilterFlag1  int
FilterFlag2  int
FilterFlag3  int

Para replicação para ilustrar isso, teríamos 5 publicações de [myTable] :

Publication  Filter
-----------  ------
NoFilter1    [all records]*  
NoFilter2    [all records]*  
Filter1      FilterFlag1 = 1
Filter2      FilterFlag2 = 1
Filter3      FilterFlag1 = 1 AND FilterFlag2 = 1  
  • Outras tabelas são combinadas nessas publicações e é por isso que a mesma tabela com filtros idênticos (nenhum) está em mais de uma publicação.

Processo de atualização atual

A maioria dos aplicativos que atualizam essa tabela faz isso percorrendo sua coleção de objetos, aplicando a alteração a esse único objeto e, em seguida, confirmando sua alteração no banco de dados antes de passar para o próximo objeto.

De uma perspectiva de rastreamento de banco de dados, isso significa que obtemos até 120 instruções de atualização quando a alteração ocorre

Exemplo

update [myTable] set Suspended = @Suspended 
where myID = @pID

Processo de atualização proposto

Como as coleções de objetos são realmente baseadas nos IDs do grupo, uma melhoria potencial é fazer uma atualização em massa (em vez de atualizações individuais) e, em seguida, atualizar a coleção de objetos. Reduzindo o número de instruções de atualização para 1 ou 2 (dependendo dos cenários de negócios).

Exemplo

update [myTable] set Suspended = @Suspended 
where myGroupID1 = @groupID1 
      and myGroupID1 = @groupID2

Impacto no LogReader?

Do ponto de vista do processamento do aplicativo, fazer uma única atualização faz sentido para mim (menos idas e voltas entre o aplicativo e o banco de dados = mais rápido), porém não tenho certeza de como o LogReader tratará os dois cenários, pois precisa processar cada registro atualizado por a transação..

O LogReader processará esses registros mais rapidamente ou mais lentamente em uma atualização em massa?

sql-server replication
  • 1 1 respostas
  • 451 Views

1 respostas

  • Voted
  1. Best Answer
    mrdenny
    2011-06-23T11:17:49+08:002011-06-23T11:17:49+08:00

    Nos registros de log, essas são instruções separadas que são gravadas no log. O leitor de log então os agruparia e os executaria como uma única transação no banco de dados.

    Se seu banco de dados usa procedimentos armazenados, você pode replicar os procedimentos armazenados, o que permitiria que a chamada do procedimento armazenado fosse replicada em vez das atualizações de dados reais.

    • 3

relate perguntas

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve