Como o otimizador decide se deve ou não usar paralelismo quando o limite de paralelismo é especificado em segundos (em hardware específico , veja abaixo), mas os custos estimados de CPU são supostamente sem unidades? A estimativa é tratada como se fossem segundos ou há uma conversão acontecendo internamente com base em algumas métricas de hardware?
Do MS: limite de custo para opção de paralelismo
O custo refere-se a um tempo decorrido estimado em segundos necessário para executar o plano serial em uma configuração de hardware específica
como-eu-leio-o-custo-da-consulta-e-é-sempre-uma-porcentagem
sql-server-execution-plan-estimated-io-cost-estimated-cpu-cost-no-unit
O limite de paralelismo é baseado no custo planejado estimado. Se o custo estimado do plano ultrapassar o limite de paralelismo, o otimizador também considerará as opções de plano paralelo. Não há nenhuma outra medida envolvida.
Nos primórdios do otimizador, o custo planejado era derivado com base em medições reais em um computador específico. Desde então, em muitas versões, muita coisa mudou com o otimizador, portanto, anexar qualquer unidade de tempo ao "custo estimado" atual não é mais apropriado. Por exemplo, não apenas o tempo de execução estimado influencia esse custo estimado em versões mais recentes do SQL Server. A única coisa que está dizendo é que o otimizador assume que um plano de consulta com um custo estimado mais alto para a mesma consulta executada em circunstâncias idênticas exigirá mais recursos.
Você não pode nem comparar o custo estimado de duas consultas diferentes. É bastante fácil criar duas consultas em que o custo estimado de uma é dez vezes maior, mas o tempo de execução da outra é, na verdade, significativamente maior. Portanto, você nunca deve usar o custo estimado de um plano de consulta para ajuste de desempenho.
A citação em sua pergunta é uma sobra daqueles primeiros dias, quando ainda fazia sentido. Na época, também foi mencionado na seção explicando o custo estimado da consulta.