AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 10873
Accepted
vstrien
vstrien
Asked: 2012-01-19 02:21:21 +0800 CST2012-01-19 02:21:21 +0800 CST 2012-01-19 02:21:21 +0800 CST

Desempenho do SQL Server Linked Server: Por que as consultas remotas são tão caras?

  • 772

Tenho dois servidores de banco de dados, conectados via Linked Servers. Ambos são bancos de dados SQL Server 2008R2, e a conexão do servidor vinculado é feita por meio de um link "SQL Server" regular, usando o contexto de segurança do logon atual. Os servidores vinculados estão ambos no mesmo datacenter, portanto, a conexão não deve ser um problema.

Eu uso a seguinte consulta para verificar quais valores da coluna identifierestão disponíveis remotamente, mas não localmente.

SELECT 
    identifier 
FROM LinkedServer.RemoteDb.schema.[TableName]

EXCEPT

SELECT DISTINCT
    identifier 
FROM LocalDb.schema.[TableName] 

Em ambas as tabelas há índices não clusterizados na coluna identifier. Localmente são cerca de 2,6 milhões de linhas, remotamente apenas 54. No entanto, ao analisar o plano de consulta, 70% do tempo de execução é dedicado à "execução de consulta remota". Além disso, ao estudar o plano de consulta completo, o número de linhas locais estimadas é 1em vez de 2695380(que é o número de linhas estimadas ao selecionar apenas a consulta posterior a EXCEPT). Plano de execução Ao executar esta consulta, leva muito tempo.

Isso me faz pensar: Por que isso? A estimativa está "apenas" longe ou as consultas remotas em servidores vinculados são realmente tão caras?

sql-server sql-server-2008-r2
  • 5 5 respostas
  • 43583 Views

5 respostas

  • Voted
  1. Best Answer
    Martin Smith
    2012-01-19T06:42:06+08:002012-01-19T06:42:06+08:00

    O plano que você tem no momento parece o plano mais ideal para mim.

    Não concordo com a afirmação nas outras respostas de que está enviando as linhas de 2,6 milhões para o servidor remoto.

    O plano me parece que, para cada uma das 54 linhas retornadas da consulta remota, ele está realizando uma busca de índice em sua tabela local para determinar se há correspondência ou não. Este é praticamente o plano ideal.

    Substituir por uma junção de hash ou junção de mesclagem seria contraproducente devido ao tamanho da tabela e adicionar uma #temptabela intermediária apenas adiciona uma etapa adicional que parece não oferecer nenhuma vantagem.

    • 10
  2. Oded
    2012-01-19T02:25:56+08:002012-01-19T02:25:56+08:00

    Conectar-se a um recurso remoto é caro. Período.

    Uma das operações mais caras em qualquer ambiente de programação é a E/S de rede (embora a E/S de disco tenda a superá-la).

    Isso se estende a servidores vinculados remotos. O servidor que chama o servidor remoto vinculado precisa primeiro estabelecer uma conexão, depois uma consulta precisa ser executada no servidor remoto, os resultados são retornados e a conexão é fechada. Tudo isso leva tempo na rede.


    Você também deve estruturar sua consulta de forma que transfira o mínimo de dados pela rede. Não espere que o banco de dados otimize para você.

    Se eu fosse escrever essa consulta, selecionaria os dados remotos em uma variável de tabela (ou em uma tabela temporária) e usaria isso em conjunto com a tabela local. Isso garante que apenas os dados que precisam ser transferidos serão transferidos.

    A consulta que você está executando pode facilmente enviar 2,6 milhões de linhas para o servidor remoto para processar a EXCEPTcláusula.

    • 6
  3. joakon
    2018-05-08T05:45:25+08:002018-05-08T05:45:25+08:00

    Não sou especialista, mas se você estiver usando Union, Except ou Intersect, não precisará usar "Distinct". Dependendo dos valores de LocalDb.schema.[TableName], o desempenho da consulta pode ser melhorado.

    SELECT 
        identifier 
    FROM LinkedServer.RemoteDb.schema.[TableName]
    
    EXCEPT
    
    SELECT 
        identifier 
    FROM LocalDb.schema.[TableName]
    
    • 1
  4. Lieven Keersmaekers
    2012-01-19T02:56:50+08:002012-01-19T02:56:50+08:00

    Oded está certo, o problema de desempenho é causado pelo envio de 2,6 milhões de linhas para o seu servidor remoto.

    Para corrigir esse problema, você pode forçar os dados remotos (54 linhas) sendo enviados para você usando uma tabela temporária ou na memória.

    Usando uma tabela temporária

    SELECT  identifier 
    INTO    #TableName
    FROM    LinkedServer.RemoteDb.schema.[TableName]
    
    SELECT  identifier
    FROM    #TableName
    EXCEPT
    SELECT  DISTINCT identifier 
    FROM    LocalDb.schema.[TableName] 
    
    DROP    #TableName
    
    • 0
  5. Alen
    2018-05-08T07:19:25+08:002018-05-08T07:19:25+08:00

    Acho que é melhor replicar a tabela remota para o servidor do qual você está consultando e, em seguida, executar todo o seu SQL localmente.

    • 0

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como ver a lista de bancos de dados no Oracle?

    • 8 respostas
  • Marko Smith

    Quão grande deve ser o mysql innodb_buffer_pool_size?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    restaurar a tabela do arquivo .frm e .ibd?

    • 10 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve