如何使用自定义比较器声明/使用unordered_set
for 三元组 ( tuple
)?
我需要将float
( 处理为tuple
) 的三元组存储在一组中以检查是否存在重复项。因为它是关于float
,我想使用常规比较==
是行不通的,所以需要自定义比较。
这个最小的代码无法编译:
>> cat unordered_set_triplet.cpp
#include <unordered_set>
#include <tuple>
#include <limits> // numeric_limits
#include <cmath> // fabs
#include <functional> // hash
using triplet = std::tuple<float, float, float>;
bool triplet_equal(triplet const & lhs, triplet const & rhs) {
float const eps = std::numeric_limits<float>::epsilon();
if (std::fabs(std::get<0>(lhs) - std::get<0>(rhs)) > eps) return false;
if (std::fabs(std::get<1>(lhs) - std::get<1>(rhs)) > eps) return false;
if (std::fabs(std::get<2>(lhs) - std::get<2>(rhs)) > eps) return false;
return true;
}
using unordered_set_triplet = std::unordered_set<triplet,
std::hash<triplet>,
decltype(triplet_equal)>;
int main() {
//unordered_set_triplet s; // Compilation: KO...
unordered_set_triplet s(10, std::hash<triplet>, triplet_equal);
s.insert({1.f, 2.f, 3.f});
}
我得到:
>> g++ -std=c++20 -o unordered_set_triplet unordered_set_triplet.cpp
In file included from /usr/include/c++/12/bits/hashtable.h:35,
from /usr/include/c++/12/unordered_set:46,
from unordered_set_triplet.cpp:1:
/usr/include/c++/12/bits/hashtable_policy.h: In instantiation of ‘struct std::__detail::_Hashtable_ebo_helper<0, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&), false>’:
/usr/include/c++/12/bits/hashtable_policy.h:1631:12: required from ‘struct std::__detail::_Hashtable_base<std::tuple<float, float, float>, std::tuple<float, float, float>, std::__detail::_Identity, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&), std::hash<std::tuple<float, float, float> >, std::__detail::_Mod_range_hashing, std::__detail::_Default_ranged_hash, std::__detail::_Hashtable_traits<true, true, true> >’
/usr/include/c++/12/bits/hashtable.h:182:11: required from ‘class std::_Hashtable<std::tuple<float, float, float>, std::tuple<float, float, float>, std::allocator<std::tuple<float, float, float> >, std::__detail::_Identity, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&), std::hash<std::tuple<float, float, float> >, std::__detail::_Mod_range_hashing, std::__detail::_Default_ranged_hash, std::__detail::_Prime_rehash_policy, std::__detail::_Hashtable_traits<true, true, true> >’
/usr/include/c++/12/bits/unordered_set.h:100:18: required from ‘class std::unordered_set<std::tuple<float, float, float>, std::hash<std::tuple<float, float, float> >, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&)>’
unordered_set_triplet.cpp:21:26: required from here
/usr/include/c++/12/bits/hashtable_policy.h:1204:11: error: data member ‘std::__detail::_Hashtable_ebo_helper<0, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&), false>::_M_tp’ invalidly declared function type
1204 | _Tp _M_tp{};
| ^~~~~
/usr/include/c++/12/bits/hashtable.h: In instantiation of ‘class std::_Hashtable<std::tuple<float, float, float>, std::tuple<float, float, float>, std::allocator<std::tuple<float, float, float> >, std::__detail::_Identity, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&), std::hash<std::tuple<float, float, float> >, std::__detail::_Mod_range_hashing, std::__detail::_Default_ranged_hash, std::__detail::_Prime_rehash_policy, std::__detail::_Hashtable_traits<true, true, true> >’:
/usr/include/c++/12/bits/unordered_set.h:100:18: required from ‘class std::unordered_set<std::tuple<float, float, float>, std::hash<std::tuple<float, float, float> >, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&)>’
unordered_set_triplet.cpp:21:26: required from here
/usr/include/c++/12/bits/hashtable.h:665:7: error: function returning a function
665 | key_eq() const
| ^~~~~~
In file included from /usr/include/c++/12/unordered_set:47:
/usr/include/c++/12/bits/unordered_set.h: In instantiation of ‘class std::unordered_set<std::tuple<float, float, float>, std::hash<std::tuple<float, float, float> >, bool(const std::tuple<float, float, float>&, const std::tuple<float, float, float>&)>’:
unordered_set_triplet.cpp:21:26: required from here
/usr/include/c++/12/bits/unordered_set.h:632:7: error: function returning a function
632 | key_eq() const
| ^~~~~~
unordered_set_triplet.cpp: In function ‘int main()’:
unordered_set_triplet.cpp:21:49: error: expected primary-expression before ‘,’ token
21 | unordered_set_triplet s(10, std::hash<triplet>, triplet_equal);
| ^
如何解决这个问题?
编辑
使用 (ordered) 也不起作用set
:
>> cat set_triplet.cpp
#include <iostream>
#include <set>
#include <tuple>
#include <limits> // numeric_limits
#include <cmath> // fabs
#include <functional> // hash
using triplet = std::tuple<float, float, float>;
bool triplet_equal(triplet const & lhs, triplet const & rhs) {
float const eps = std::numeric_limits<float>::epsilon();
if (std::fabs(std::get<0>(lhs) - std::get<0>(rhs)) > eps) return false;
if (std::fabs(std::get<1>(lhs) - std::get<1>(rhs)) > eps) return false;
if (std::fabs(std::get<2>(lhs) - std::get<2>(rhs)) > eps) return false;
return true;
}
using set_triplet = std::set<triplet, std::hash<triplet>, decltype(triplet_equal)>;
int main() {
//set_triplet s; // Compilation: KO...
set_triplet s(10, std::hash<triplet>, triplet_equal);
s.insert({1.f, 2.f, 3.f});
s.insert({1.0000001f, 2.0000001f, 3.0000001f});
for (auto const & t : s) std::cout << std::get<0>(t) << ", " << std::get<1>(t) << ", " << std::get<2>(t) << std::endl;
}
什么容器适合使用?
triplet
可以看到 3D 点 (XYZ):我需要处理/检测重复点。
迄今为止最好的解决方案
i
使用以这种方式i = (int) 1000000 * f
从 float构建的整数组成的元组f
并使用 set(operator<
乘以 1000000 后将遵守高达 6 位精度的严格排序)。
>> cat set_uint32_triplet.cpp
#include <iostream>
#include <set>
#include <tuple>
using triplet_uint32 = std::tuple<uint32_t, uint32_t, uint32_t>;
using triplet_float = std::tuple<float, float, float>;
triplet_uint32 convert(triplet_float const & f) {
uint32_t precision = 1000000; // Allow for 6-digit precision.
uint32_t x = (uint32_t) (std::get<0>(f) * precision);
uint32_t y = (uint32_t) (std::get<1>(f) * precision);
uint32_t z = (uint32_t) (std::get<2>(f) * precision);
return {x, y, z};
}
int main() {
triplet_float pt1 = {1.f, 2.f, 3.f};
triplet_float pt2 = {1.0000001f, 2.0000001f, 3.0000001f}; // Considered duplicate with pt1.
triplet_float pt3 = {1.000001f, 2.000001f, 3.000001f}; // Considered NOT duplicate with pt1.
std::set<triplet_uint32> s;
s.insert(convert(pt1));
s.insert(convert(pt2));
s.insert(convert(pt3));
std::cout << "set size " << s.size() << std::endl;
for (auto const & t : s) std::cout << "set item " << std::get<0>(t) << ", " << std::get<1>(t) << ", " << std::get<2>(t) << ", " << std::endl;
}
>> g++ -std=c++20 -o set_uint32_triplet set_uint32_triplet.cpp
>> ./set_uint32_triplet
set size 2
set item 1000000, 2000000, 3000000,
set item 1000000, 2000001, 3000001,
这可能不是您想要的答案,但它为您提供了已接受答案的传递性问题的解决方案。
std::tuple<int, int, int>
通过将浮点数乘以某个常数(例如 10000)并向下舍入来使用和量化浮点数。比例因子将取决于您的域。如果需要保留原始值,请使用 unordered_map。使用 int 元组作为键,并添加一个 float 元组作为值。然后,当您搜索给定的三元组时,您可以在三个值中的每个值中查找相邻元组。
这更复杂,工作量更大,但这是一种更正确的方法,并且可以避免由于传递性问题而导致的 UB。
KeyEqual的问题
首先,提供给 的KeyEqual
std::unordered_set
不能是一个函数,而这正是您想要对 执行的操作decltype(triplet_equal)
。但是,它可以是函数指针。通常,您应该按如下方式使用函数对象:您不必为哈希值或
triplet_equal
构造函数提供任何值,因为它们是默认可构造的。哈希问题
下一个大问题是标准库没有
std::hash
针对元组的专门化。如果您想创建自己的元组,请查看unordered_map / unordered_set 中元组的通用哈希。然而,即使有一个,问题仍然是两个相等的元组(其中相等性由 确定
triplet_equal
)也必须具有相同的哈希值。您必须专门化std::hash
自己,以便两个相等的元组始终具有相同的哈希值,尽管浮点不精确。你也许可以通过量化float
s 来做到这一点,但我想正确地做到这一点是非常困难的。替代方案:使用
std::set
并提供比较使用起来会容易得多
std::set
,只需要您实现小于比较:请参阅编译器资源管理器中的实时示例
进一步说明
最好不要使用
std::tuple
,而是使用简单的聚合类型,如下所示:使用默认的比较运算符,可以很容易地获得 , 的所有功能
std::tuple
,并且您可以编写lhs.x
而不需要std::get<0>(lhs)
和其他烦恼。