No SQL Server, sempre achei difícil obter o máximo de linhas para um conjunto de dados. Estou procurando uma lista dos métodos para recuperar o máximo de linhas com algumas orientações sobre desempenho e capacidade de manutenção.
Tabela de amostra:
DECLARE @Test TABLE (ID INT IDENTITY(1,1), name VARCHAR(50),
dateOfBirth DATETIME, TaxNumber varchar(10))
INSERT INTO @Test (name, dateOfBirth, TaxNumber)
SELECT 'Fred', convert(datetime, '25/01/1976', 103), '123' UNION ALL
SELECT 'Bob', convert(datetime, '03/03/1976', 103), '234' UNION ALL
SELECT 'Jane', convert(datetime, '13/06/1996', 103), '345' UNION ALL
SELECT 'Fred', convert(datetime, '14/02/1982', 103), '456' UNION ALL
SELECT 'Bob', convert(datetime, '25/10/1983', 103), '567' UNION ALL
SELECT 'Jane', convert(datetime, '12/04/1995', 103), '678' UNION ALL
SELECT 'Fred', convert(datetime, '03/03/1976', 103), '789'
select * from @Test
Dá:
ID name dateOfBirth TaxNumber
----------- --------- ----------------------- ----------
1 Fred 1976-01-25 00:00:00.000 123
2 Bob 1976-03-03 00:00:00.000 234
3 Jane 1996-06-13 00:00:00.000 345
4 Fred 1982-02-14 00:00:00.000 456
5 Bob 1983-10-25 00:00:00.000 567
6 Jane 1995-04-12 00:00:00.000 678
7 Fred 1976-03-03 00:00:00.000 789
Se eu quiser recuperar os detalhes completos da pessoa mais velha (grupo por nome), que métodos posso usar?
Saída desejada:
ID name dateOfBirth TaxNumber
----------- --------- ----------------------- ----------
1 Fred 1976-01-25 00:00:00.000 123
2 Bob 1976-03-03 00:00:00.000 234
6 Jane 1995-04-12 00:00:00.000 678
Dois métodos usuais: agregação e função de classificação.
A agregação funciona no SQL Server 2000. Ambas as formas podem usar um CTE ou tabela derivada
Para desempenho, descobri que o agregado funciona melhor. No entanto, parece que as funções de classificação do SQL Server 2008 funcionam muito melhor do que no SQL Server 2005. Ainda não estou usando o SQL Server 2008 no dia a dia (grande dinossauro corporativo), então não posso comentar.
Existem 2 perguntas SO relevantes, mas não consigo encontrá-las no momento. Uma é uma questão sobre IO lógico alto com funções de classificação, outra é o teste de classificação em comentários sobre SQL 2k5 vs 2k8. Desculpe.