SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

Asked: 2022-08-20 11:36:05 +0800 CST2022-08-20 11:36:05 +0800 CST 2022-08-20 11:36:05 +0800 CST

Procedimento armazenado com desempenho insatisfatório usando dados em cache durante o teste

772

Eu tenho um procedimento armazenado que leva cerca de 15 segundos para ser executado pela primeira vez e as execuções subsequentes levam de 1 a 2 segundos. Se eu esperar por uma hora e executá-lo novamente, leva 15 segundos novamente.

Suponho que esteja usando os dados armazenados em cache no pool de buffers nas execuções subsequentes, enquanto na primeira vez ele precisa carregar dados do disco para o pool de buffers. Estou tentando ajustar esse procedimento armazenado, mas após a primeira execução não consigo testar minhas alterações, pois leva apenas 1 a 2 segundos.

Eu sei que posso usar o DBCC DROPCLEANBUFFERScomando para liberar o cache e executar meu procedimento armazenado, mas não tenho permissão para limpar o cache no meu trabalho. Eu tentei WITH RECOMPILEtambém, mas isso só cria um novo plano, mas ainda usa os dados em cache. Existe outra maneira de forçar o procedimento armazenado a não usar os dados em cache?

2 respostas

Voted

David Browne - Microsoft · Answer 1 · 2022-08-20T12:26:48+08:00

Não. Salve a CPU e aguarde as estatísticas do plano de execução real onde você está vendo a duração de 15 segundos. Em seguida, trabalhe para minimizar a CPU e as leituras. Se você vir que leituras X = 15 segundos de esperas de PAGEIOLATCH, poderá obter uma estimativa razoável do impacto da redução de leituras.

O importante é descobrir e corrigir as consultas que estão causando a rotatividade do buffer pool. Sua consulta provavelmente é pelo menos parcialmente culpada, mas você precisa descobrir por que os dados dessa consulta não estão presos no cache. Podem ser outras consultas, podem precisar de mais memória, ou melhor compactação, ou para evitar varreduras de tabela, etc.

Randy in Marin · Answer 2 · 2022-08-24T15:25:20+08:00

Quatro comentários. Primeiro, se você precisar fazer isso, providencie um backup do banco de dados restaurado em um sistema de teste onde você possa usar DBCC DROPCLEANBUFFERS.

Segundo, use leituras lógicas em vez de leituras físicas. Eu não gosto de depender de leituras físicas e apenas duração para otimização de consulta na maioria dos casos. Se você se concentrar nas leituras lógicas e reduzi-las, as leituras físicas normalmente seguirão. Em alguns casos, você realmente deve ler muitos dados e reduzir as leituras lógicas não é uma opção. Às vezes, uma verificação do intestino pode ajudar. Se você estiver fazendo 10.000 leituras de páginas lógicas em uma tabela de 1.000 páginas para obter 1 registro, algo está muito errado. (Vi coisas ruins como essa.) Se você tem um relatório com todos os dados, então 1.000 leituras lógicas em uma tabela de 1.000 páginas é ótimo.

Terceiro, meça o desempenho. Você pode usar as seguintes instruções SET na conexão usada para testar a consulta. Ele fornecerá o tempo de CPU usado e o uso de IO para cada tabela. Esses SETs precisam ser executados apenas uma vez. Eles permanecem ativos até que a conexão seja fechada ou sejam DESLIGADOS. Isso é bom para 1 ou algumas consultas, mas será muito barulhento para alguns códigos.

SET STATICS IO ON
SET STATISTICS TIME ON

Será algo como abaixo.

Table 'Workfile'. Scan count 0, logical reads 0, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'Worktable'. Scan count 1, logical reads 22693, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'syssingleobjrefs'. Scan count 1, logical reads 2, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'sysschobjs'. Scan count 1, logical reads 51, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'syspalnames'. Scan count 1, logical reads 2, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'sysobjvalues'. Scan count 1, logical reads 3, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
Table 'syscolpars'. Scan count 1, logical reads 9, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.

 SQL Server Execution Times:
   CPU time = 859 ms,  elapsed time = 913 ms.

Se tudo o que você precisa é de um resumo do desempenho total, algo como o fluxo pode ser bom o suficiente. O SQL Server 2014 ou posterior é necessário; caso contrário, o tempo decorrido precisa ser substituído por algo que funcione (por exemplo, datediff). BTW, o request_id é incluído apenas no caso de MARS estar ativado. Não deixe as instruções SET acima habilitadas para esta, a menos que você queira um bom exemplo de ruído. (Os resultados aqui e acima são para consultas diferentes e não serão correspondentes.)

DECLARE @time int, @cpu int, @logical bigint, @reads bigint, @writes bigint

SELECT @time = -total_elapsed_time, @cpu = -cpu_time, @logical = -logical_reads, @reads = -reads, @writes = -writes
FROM sys.dm_exec_requests WITH (NOLOCK) WHERE session_id = @@SPID AND request_id = CURRENT_REQUEST_ID()
    
    WAITFOR DELAY '00:00:01.234';-- code to measure - wait
    DECLARE @t1 int=0, @t2 float=0; while @t1<1000000 begin set @t2=@t2+.5*power(.5,@t1) set @t1+=1 end;-- code to measure - cpu
    SELECT TOP 1000000 t1.*, t2.name as [x] INTO temp_xxxx FROM [sys].[all_objects] t1 CROSS JOIN [sys].[all_columns] t2; SELECT COUNT(*) FROM temp_xxxx; DROP TABLE temp_xxxx;-- code to measure - logical reads and writes

SELECT @time += total_elapsed_time, @cpu += cpu_time, @logical += logical_reads, @reads += reads, @writes += writes
FROM sys.dm_exec_requests WITH (NOLOCK) WHERE session_id = @@SPID AND request_id = CURRENT_REQUEST_ID()

RAISERROR('time %d ms, cpu %d ms, logical %I64d pages, reads %I64d pages, writes %I64d pages', 10, 1, @time, @cpu, @logical, @reads, @writes) WITH NOWAIT

(1000000 rows affected)
(1 row affected)
time 3228 ms, cpu 1964 ms, logical 71094 pages, reads 56 pages, writes 18303 pages

Quarto, se o código já estiver otimizado, pode haver outros problemas. Se você tiver 100 GB de dados ativos e apenas 8 GB de RAM... (nos últimos 20 anos, lembro-me de um caso em que foi HW. A consulta também era péssima, mas um problema de vCPU a levou ao limite. Um problema de desempenho provavelmente será um problema de otimização com sua consulta. No entanto, isso seria um tópico separado.)

Procedimento armazenado com desempenho insatisfatório usando dados em cache durante o teste

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Procedimento armazenado com desempenho insatisfatório usando dados em cache durante o teste

2 respostas

relate perguntas