O padrão exige que isso operator->()
seja definido para iteradores não contíguos do tipo past-the-end?
Fundo:
- Independentemente da categoria do iterador, é permitido
operator*()
exibir comportamento indefinido quando o iterador aponta para o passado-do-fim. Isso é explícito em https://en.cppreference.com/w/cpp/iterator , seção "Desreferenciabilidade e validade", que diz: "Valores de um iterador i para os quais a expressão *i é definida são chamados desreferenciáveis. A biblioteca padrão nunca assume que valores passado-do-fim são desreferenciáveis." - EDIT: A conclusão neste tópico está errada: veja minha resposta abaixo. Para iteradores contíguos , acredito que não é permitido
operator->()
exibir comportamento indefinido quando o iterador aponta para o passado-do-fim. Isso pode ser inferido de duas seções em cppreference: (1) Em https://en.cppreference.com/w/cpp/iterator/contiguous_iterator , a seção "Requisitos semânticos" define o iterador não desreferenciávelc
e estabelece requisitos parastd::to_address(c)
os quais implica questd::to_address(c)
não exibe comportamento indefinido. (2) em https://en.cppreference.com/w/cpp/memory/to_address, ele fornece uma "Possível implementação" ondestd::to_address
depende deoperator->()
. EDIT: A "possível implementação" não usaoperator->()
casopointer_traits
seja definida para o iterador; se for esse o caso, parece permitidooperator->()
não ser definida para iteradores finais.
É menos claro se iteradores não contíguos podem implementar operator->()
de forma que seu comportamento seja indefinido para iteradores que terminam no final. Aqui estão várias "evidências"/"dicas" que encontrei relacionadas a isso:
- Conceitos de iteradores C++20 não contíguos parecem não exigir que isso
operator->()
seja definido. Isso simplesmente não é mencionado entre todos os requisitos definidos em https://en.cppreference.com/w/cpp/iterator/random_access_iterator , ou os requisitos dos quais dependem, AFAICS. - O conceito de iterador contíguo em C++20,
std::contiguous_iterator
, requeroperator->()
: como mencionado acima, isso pode ser inferido, poisstd::to_address
deve ser definido, e a "Possível implementação" parastd::to_address
usosoperator->()
. E a página https://en.cppreference.com/w/cpp/memory/to_address menciona explicitamentestd::contiguous_iterator
. Como não menciona outros tipos de iteradores, isso não implica nada para iteradores não contíguos, se bem me lembro. - As categorias de iteradores legados exigem que
operator->()
seja definido paraLegacyInputIterator
e mais forte (veja a tabela em https://en.cppreference.com/w/cpp/named_req/InputIterator ) e isso é qualificado pela "Pré-condição: i é desreferenciável". Em outras palavras, há uma exceção explícita que permite que iteradores que terminam no passado exibam comportamento indefinido. Não vejo essa pré-condição removida para nenhuma das categorias de iteradores legados mais fortes (a propósito, nem mesmo https://en.cppreference.com/w/cpp/named_req/ContiguousIterator , então isso parece uma diferença entreLegacyContiguousIterator
estd::contiguous_iterator
). - Por outro lado, em https://en.cppreference.com/w/cpp/iterator , seção "Desreferenciabilidade e validade", menciona-se que ______
operator*()
não precisa ser definido para iteradores que terminam no passado, mas não menciona _______operator->()
. Portanto, isso pode sugerir que a exceção que permite que algumas operações em iteradores que terminam no passado sejam indefinidas não se aplica necessariamente aoperator->()
_______.
Portanto, é fácil se confundir, e vejo bastante "evidência"/"dicas" relacionadas a iteradores não contíguos, operator->()
e passado-do-fim. Mas não há nenhum requisito explícito, até onde consegui encontrar, que determine se iteradores não contíguos podem exibir comportamento indefinido quando operator->()
o iterador aponta para passado-do-fim. Alguém tem uma resposta mais definitiva?
Editar : Obrigado por vários comentários úteis. Para dar um contexto, possivelmente respondendo a algumas das respostas: O lado prático, um pouco simplificado, é que eu defini wrappers de iteradores , ou seja, classes de iteradores personalizadas cuja implementação depende de um iterador existente ("encapsulado"). O tipo do iterador encapsulado é fornecido como um parâmetro de modelo e o iterador encapsulado é fornecido como um argumento do construtor. Eu, descuidadamente, presumi que poderia definir operator->()
na classe encapsuladora como &*wrapped_iterator
. Isso funcionou no clang, gcc, na compilação de lançamento do MSVC e até mesmo na compilação de depuração do MSVC para iteradores não contíguos. No entanto, resultou em falhas de asserção na compilação de depuração do MSVC para iteradores contíguos, em funções como std::vector::assign(first,last)
onde first e last são wrappers em torno de iteradores contíguos e first e last são ambos iteradores passados do fim. O motivo foi que o MSVC vector::assign
invoca std::address_of(first)
even if first==last
, o que eu não previ. Por sua vez, address_of
invocado first.operator->()
para o meu wrapper de iterador contíguo. Como eu havia definido operator->()
como &*wrapped_iterator
, ele invoca operator*
o iterador encapsulado cujo comportamento sob as condições fornecidas é indefinido. Neste caso específico, resultou em uma falha de asserção, porque o modo de depuração do MSVC tem um código especial que verifica coisas como esta ( _ITERATOR_DEBUG_LEVEL
).
Então, preciso alterar a implementação de operator->()
. no meu wrapper de iterador. Minha primeira ideia era fazer com que ele invocasse operator->()
o iterador encapsulado. No entanto, não há garantia de que isso seja definido (veja a resposta aceita). O que preciso fazer é invocar std::to_address
o iterador encapsulado.
Pela minha interpretação da norma, a
random_access_iterator
não é necessário para definiroperator->
. Portanto, algoritmos genéricos devem usar apenasoperator*
. É claro que iteradores concretos podem definir métodos adicionais; pelo que sei, a norma não impõe requisitos para eles. Portanto, um iterador não contíguo com UBend.operator->()
deve ser suficiente; algoritmos C++20 não devem ser chamadosoperator->
.(Acho que a lógica aqui é que alguns iteradores podem querer retornar elementos por valor, mas
operator->
é necessário retornar um ponteiro. Então esses iteradores são forçados a não definir nenhumoperator->
.)É apenas
contiguous_iterator
isso que introduz ooperator->
requisito (indiretamente viastd::to_address
). Lá, apesar do reflexo comum de "obviamente é um comportamento indefinido" nos comentários aqui, ele não deve ter comportamento indefinido: deve ser mantido mesmo quando for um iterador que termina no final. Isso faz sentido quando você considera que um iterador contíguo que termina no final pode ser convertido em um ponteiro que termina no final via .std::to_address
(c) ==
std::to_address
(a) +
std::iter_difference_t
<I>(c - a)
c
&c.operator->()
A situação é diferente para iteradores legados (algoritmos anteriores ao C++20): estes esperam que
a->m
seja equivalente a(*a).m
([input.iterators]
tabela). Isso também permite UB para iteradores não contíguos.Observe que esses requisitos de iterador legado ainda são usados no C++20, por exemplo, para
std::sort
; somente as funções mais recentes, exclusivas do C++20,std::ranges::sort
usam os novos requisitos de iterador baseados em conceitos.(a propósito, essas questões de advogados linguísticos deveriam ser baseadas no texto padrão real, não na cppreference. Embora neste caso não haja nenhuma diferença significativa entre eles.)
A resposta de @Daniel está correta para iteradores não contíguos, então isso responde à minha pergunta.
Preciso corrigir minha pergunta sobre afirmações sobre iteradores contíguos: nem sempre é necessário que "to"
operator->()
seja definido para iteradores finais — isso depende sepointer_traits<It>::to_address(it)
é definido para o iterador. As duas seções relevantes da norma são:[iterator.concept.contiguous] Isso requer que
std::to_address
seja definido para iteradores contíguos, mesmo após o fim.[pointer.conversion]
Especifica que
std::to_address
retornato_address(p.operator->())
, sepointer_traits<Ptr>::to_address(p)
não estiver bem formado. Mas sepointer_traits<Ptr>::to_address(p)
estiver bem formado, não requer nada parap.operator->()
.Por isso:
Uma implementação de iterador contíguo que define
pointer_traits<It>::to_address(it)
é livre para deixar o comportamento deit.operator->()
indefinido para iteradores que já passaram do fim.Uma implementação de iterador contíguo que não define
pointer_traits<It>::to_address(it)
deve definirit.operator->()
para iteradores que já passaram do fim.(Em termos do meu wrapper de iterador: não quero especializar
pointer_traits
meu iterador. Portanto, preciso garantir que eleIteratorWrapper::operator->()
seja definido mesmo para iteradores finais contíguos. Portanto, não devo implementá-lo retornandowrapped_iterator.operator->()
, que pode ser indefinido para iteradores finais contíguos se o tipo de iterador encapsulado for especializadopointer_traits
. Em vez disso, devo implementá-lo retornandostd::to_address(wrapped_iterator)
, que é garantido que seja definido para todos os iteradores contíguos válidos, incluindo iteradores finais.)