标准是否要求operator->()
为非连续的末端迭代器定义?
背景:
operator*()
无论迭代器属于哪种类别,当迭代器指向末尾之后的值时,都允许表现出未定义的行为。这一点在https://en.cppreference.com/w/cpp/iterator的“可解引用性和有效性”一节中明确指出:“对于迭代器 i ,如果表达式 *i 已定义,则该值被称为可解引用的。标准库从不假设末尾之后的值是可解引用的。”- 编辑:此点的结论是错误的:请参阅下面的答案。对于连续
operator->()
迭代器,我认为当迭代器指向末尾之后时,不允许出现未定义的行为。这可以从 cppreference 中的两个部分推断出来:(1) 在https://en.cppreference.com/w/cpp/iterator/contiguous_iterator上,“语义要求”部分定义了不可解引用的迭代器c
,并说明了std::to_address(c)
暗示std::to_address(c)
不会出现未定义行为的要求。(2) 在https://en.cppreference.com/w/cpp/memory/to_address上,它提供了一个“可能的实现”,其中std::to_address
依赖于operator->()
。编辑:如果迭代器已定义,则“可能的实现”不使用;如果是这种情况,则似乎允许不为末尾迭代器定义 。operator->()
pointer_traits
operator->()
目前尚不清楚是否允许非连续operator->()
迭代器实现,因此对于尾后迭代器,其行为是未定义的。以下是我找到的与此相关的各种“证据”/“提示”:
- 非连续的 C++20 迭代器概念似乎根本不需要定义它。据我所知, https://en.cppreference.com/w/cpp/iterator/random_access_iterator
operator->()
中定义的所有要求,或者它们所依赖的要求,根本没有提到这一点。 - 连续的 C++20 迭代器概念
std::contiguous_iterator
需要operator->()
:如上所述,由于std::to_address
必须定义 ,因此可以推断出 ,并且 的“可能实现”std::to_address
使用operator->()
。并且页面https://en.cppreference.com/w/cpp/memory/to_address明确提到std::contiguous_iterator
。由于它没有提及其他迭代器类型,因此对于非连续迭代器 IIUC 来说,这并不意味着任何含义。 - 旧式迭代器类别要求
operator->()
为 和 更强的 定义(参见https://en.cppreference.com/w/cpp/named_req/InputIteratorLegacyInputIterator
上的表格),并且满足“前提条件:i 可解引用”的条件。换句话说,存在一个明确的例外,允许尾后迭代器表现出未定义的行为。我没有看到任何更强的旧式迭代器类别删除了这个前提条件(仅供参考,甚至https://en.cppreference.com/w/cpp/named_req/ContiguousIterator也没有,所以这看起来像是和之间的区别)。LegacyContiguousIterator
std::contiguous_iterator
- 另一方面,在https://en.cppreference.com/w/cpp/iterator的“可解引用性和有效性”部分中,它提到
operator*()
对于尾后迭代器不需要定义,但没有提到operator->()
。因此,这可能表明允许对尾后迭代器进行某些操作未定义的例外不一定适用于operator->()
。
所以,很容易让人感到困惑,我看到了不少与非连续迭代器、operator->()
以及末尾过长相关的“证据”/“提示”。但据我所知,没有明确的要求规定非连续迭代器在operator->()
指向末尾过长时是否允许表现出未定义的行为。有人能给出更明确的答案吗?
编辑:感谢几条有用的评论。提供一些背景信息,可能是为了回答一些回复:实际操作方面,稍微简化一下,我定义了迭代器包装器,即自定义迭代器类,其实现依赖于现有的(“包装的”)迭代器。包装的迭代器的类型作为模板参数给出,包装的迭代器作为构造函数参数给出。我粗心地认为我可以operator->()
在包装器类中定义为&*wrapped_iterator
。这在 clang、gcc、MSVC 发布版本,甚至在 MSVC 调试版本中对于非连续迭代器都有效。然而,它导致 MSVC 调试版本中对于连续迭代器的断言失败,在诸如std::vector::assign(first,last)
first 和 last 是连续迭代器的包装器,以及 first 和 last 都是尾后迭代器的函数中。原因是 MSVCvector::assign
调用了std::address_of(first)
even if first==last
,这是我没有预料到的。反过来,它为我的连续迭代器包装器address_of
调用了。first.operator->()
由于我已将其定义operator->()
为&*wrapped_iterator
,因此它会operator*
在包装的迭代器中调用,而该迭代器在给定条件下的行为是未定义的。在这个特定情况下,它导致了断言失败,因为 MSVC 的调试模式有特殊的代码来检查类似这样的内容 ( _ITERATOR_DEBUG_LEVEL
)。
所以我需要修改迭代器包装器的实现operator->()
。我最初的想法是让它在包装的迭代器上调用。然而,这并不保证一定能实现(参见已接受的答案)。我需要做的是在包装的迭代器上operator->()
调用。std::to_address
根据我对标准的理解,a
random_access_iterator
不需要定义operator->
。因此,泛型算法只能使用operator*
。当然,具体迭代器可以定义其他方法,据我所知,标准对这些方法没有任何要求。因此,带有 UB 的非连续迭代器应该没问题;C++20 算法根本end.operator->()
不应该调用。operator->
(我认为这里的理由是一些迭代器可能希望按值返回元素,但
operator->
需要返回一个指针。因此这些迭代器被迫不定义任何operator->
。)只是
contiguous_iterator
引入了operator->
要求(通过 间接引入std::to_address
)。尽管这里的评论中经常出现“显然这是未定义行为”的反射,但它一定不能有未定义行为:即使是尾后迭代器,也必须成立。考虑到尾后连续迭代器可以通过 转换为尾后指针,这一点就说得通了。std::to_address
(c) ==
std::to_address
(a) +
std::iter_difference_t
<I>(c - a)
c
&c.operator->()
对于旧式迭代器(C++20 之前的算法),情况有所不同:这些迭代器期望
a->m
等价于(*a).m
([input.iterators]
table)。这也允许非连续迭代器使用 UB。请注意,这些遗留的迭代器要求仍在 C++20 中使用,例如 for
std::sort
;只有较新的 C++20 专用函数才std::ranges::sort
使用新的基于概念的迭代器要求。(顺便说一句,这些语言律师问题应该基于实际的标准文本,而不是 cppreference。尽管在这种情况下,它们之间并没有显着的区别。)
@Daniel 的回答对于非连续迭代器是正确的,所以这回答了我的问题。
我必须纠正一下关于连续迭代器声明的问题:对于末端迭代器,并不总是需要
operator->()
定义 ——这取决于pointer_traits<It>::to_address(it)
迭代器是否定义了 。该标准的两个相关部分是:[iterator.concept.contiguous]这要求
std::to_address
为连续的迭代器定义,甚至超过末尾。[pointer.conversion]
指定如果格式不正确,则
std::to_address
返回。但如果格式正确,则对 无需任何要求。to_address(p.operator->())
pointer_traits<Ptr>::to_address(p)
pointer_traits<Ptr>::to_address(p)
p.operator->()
因此:
定义的连续迭代器实现可以自由地为结束迭代器
pointer_traits<It>::to_address(it)
保留未定义的行为。it.operator->()
未定义的连续迭代器实现
pointer_traits<It>::to_address(it)
必须定义it.operator->()
末尾迭代器。(就我的迭代器包装器而言:我不想专门
pointer_traits
针对我的迭代器。因此,我需要确保IteratorWrapper::operator->()
即使对于连续的端迭代器也定义。因此,我不能通过返回来实现它wrapped_iterator.operator->()
,如果包装的迭代器类型专门化,则对于连续的端迭代器来说这可能是未定义的pointer_traits
。相反,我应该通过返回来实现它std::to_address(wrapped_iterator)
,这保证为包括端迭代器在内的所有有效的连续迭代器定义。)