Eu li que os registros em um arquivo de dados classificado (para uma tabela de banco de dados) são classificados na mesma ordem que as chaves em seu índice clusterizado correspondente - e um nó folha do índice clusterizado contém o registro de dados real correspondente à chave em o nó folha.
Isso significa que eles são fisicamente o mesmo arquivo em disco?
Se sim, a estrutura de dados em árvore do índice clusterizado é realmente parte fisicamente do arquivo de dados?
Se não, e eles são arquivos em disco fisicamente separados, o nó folha contém um ponteiro para o registro de dados? -- mas isso é o que acontece em um índice não clusterizado.
Não consigo encontrar uma resposta explícita para esta consulta. Por favor, ajude.
Você se refere a "arquivo de dados" como se os dados (linhas reais) de uma tabela estejam em um arquivo separado de outras tabelas e índices. Esse não é o caso. Eu apenas gostaria de apontar isso, já que isso pode ser uma razão que contribui para a confusão.
Há tantas informações disponíveis sobre estruturas físicas para SQL Server, então isso será super breve:
Os dados (em termos gerais) são armazenados em blocos de páginas (8KB), em um arquivo de dados de banco de dados. Existem diferentes tipos de páginas.
O índice clusterizado são os dados. Ou seja, o nível folha desse índice são as linhas reais. Ele contém todas as colunas e a classificação desse índice é, obviamente, baseada na chave de índice desse índice clusterizado. Não há mais nenhum lugar para "apontar". Quando você navegou na árvore e agora está na folha para o cl ix, você está de fato na linha de dados.
Observe também que um arquivo de dados (.mdf, .ndf) para um banco de dados (ao contrário de um arquivo de log de transações, .ldf) pode conter todos os tipos de páginas. Isso inclui páginas para índice não clusterizado, páginas para índices clusterizados, páginas para heaps (páginas de dados para tabelas que não possuem um índice clusterizado), etc.
Portanto, no nível do arquivo, não há separação entre "dados" e "índices". Você pode conseguir isso, até certo ponto, usando grupos de arquivos, mas esse é um tópico separado.
Observe também que cuidadosamente não confundi o índice clusterizado com a chave primária. Acontece que o tipo de índice padrão para o PK é um índice clusterizado. Mas isso é apenas um padrão.