A seguinte função não-template (ou seria?) retornando um lambda não genérico e com estado,
auto foo(double a) {
return [a](double b) -> double {
return a + b;
};
}
compilado para isso com GCC ou Clang . Por quê?
foo(double):
ret
Eu esperaria que não gerasse nenhuma saída .
A origem da questão
Nem me lembro por que comecei a escrever o trecho acima, mas enfim...
Inicialmente pensei que deveria ter sido compilado para algo um pouco maior, pois esperava ver add
pelo menos uma instrução.
Mas então percebi que o foo
acima não pode ser compilado sozinho, em um cpp, e então vinculado a outra TU onde é usado, porque não consigo nem escrever uma declaração - somente para ele!
Então chego ao ponto em que a única razão para escrever essa função em um arquivo sem cabeçalho é que ela é usada nesse arquivo sem cabeçalho, e nesse ponto o compilador pode presumivelmente incorporá-la onde quer que ela seja usada.
Mas se esse é o caso... então por que copilar foo
para baixo para qualquer coisa , se é a única coisa na TU? Não há nada para vincular, então por que qualquer saída é gerada para isso?
Usar um struct
+ operator()
não muda nada, pois isso
struct Bar {
double a;
double operator()(double b) const {
return a + b;
}
};
Bar bar(double a) {
return Bar{a};
}
gera o mesmo ret
código -only, o que também é óbvio em retrospecto, pois não há como vincular essa bar
função a outras TUs, se Bar
estiver oculta no arquivo cpp.
Parece uma otimização perdida que GCC e Clang presumivelmente não tentam procurar. Eles teriam que executar uma passagem de otimização extra procurando por funções que retornam lambdas como essa e tratá-las como
inline
para que pudessem evitar emitir uma definição autônoma em TUs que não precisam de uma.Mas se eles fizessem isso, eles não conseguiriam detectar violações da regra de definição única no momento do link.
Por exemplo, programa malformado se outra TU contivesse
int foo(double a){ return a; }
Então essa é uma boa razão para não tratá-lo como
inline
e não emitir nenhum asm.Mas acho que eles poderiam emitir apenas um
.global foo
;foo:
para definir o símbolo para detecção de violação de ODR, sem gastar nenhum tamanho de código em umret
. Isso seria um caso especial de geração de asm, e provavelmente não valeria o código extra nos internos do GCC ou Clang para manter o controle desse tratamento especial que ele deveria receber, e para fazê-lo.O valor de tal otimização seria mínimo, já que, como você disse, isso é apenas código morto em um programa real, onde essa função está em uma TU sem nada que a chame. Levaria tempo de compilação para procurá-la, e seria código que os desenvolvedores do GCC/Clang teriam que manter.