我很好奇哪种复制方法对于大 MB 子字符串最有效。
const char*
下面是一个示例 C++ 程序,其中有多种方法可以从到复制子字符串,std::string
但如何确定哪种方法最有效?与将子字符串从 const char* 复制到 std::string相关。
可以对所有这些可能的方法进行基准测试,但也许缺少更好的方法?也许有一些文档表明应立即避免哪些文档,因为它们需要低效的数据临时副本等,...
#include <iostream>
#include <sstream>
#include <string>
const char* str = "Hello World!";
const char* startOfWorld = str + 6; // Pointing to "World!"
size_t length = 6; // Length of "World!"
void StoreWorldIntoString(std::string& result)
{
result.assign(startOfWorld, length);
// Slower methods...
// result = std::string(startOfWorld, length);
// result.replace(0, result.length(), startOfWorld, length);
// result = std::string(startOfWorld, startOfWorld + length);
// result.append(startOfWorld, length);
// std::string fullString(str); result = fullString.substr(6, length);
// result.insert(0, startOfWorld, length);
// std::copy(startOfWorld, startOfWorld + length, std::back_inserter(result));
// std::stringstream ss; ss.write(startOfWorld, length); result = ss.str();
}
int main()
{
std::string result;
StoreWorldIntoString(result);
std::cout << result << std::endl;
return 0;
}
获胜者,冠军
根据下面的基准测试和评论,最有效的方法是assign
。
编写简单的代码
使用
result.assign
. 这正是执行此任务的函数,因此实际上可以保证它是最快的。您尝试添加的复杂性越多:
QuickBench 让我们详细测试它并查看装配体,所以让我们这样做吧。 https://quick-bench.com/q/5jxTRcmOQ0di2rTDRAyFhUQxGKg。我的第一个测试只是验证最后一个字节是否已分配,但很多测试都是作弊,并丢弃结果,所以现在我验证整个结果的哈希值。
assign
、insert
、replace
、append
、我添加的新的std::copy(startOfWorld, startOfWorld + length, result.begin())
都是最快的,而且基本是一样的。(事实上,assign
、replace
和insert
都只是_M_replace
在幕后调用相同的方法)std::string(startOfWorld, length)
由于额外的分配,仅慢了约 30%。std::string fullString(str); result = fullString.substr(6, length)
由于额外的分配和完整的副本,速度慢了约 90%。std::string(startOfWorld, startOfWorld + length)
由于额外的分配和复制,速度慢了约 110%,这让我感到惊讶。这在统计上可能并不比之前的版本慢,并且可能只是一个不幸的测量。std::stringstream ss; ss.write(startOfWorld, length)
速度慢约 880%。流有很多虚拟方法调用,除了 I/O 之外,通常最好避免使用。std::copy(startOfWorld, startOfWorld + length, std::back_inserter(result))
速度慢了大约 1100%。每个字母都会进行单独的检查,看看是否需要调整大小。这就是为什么您通常应该使用resize
然后直接分配(我在std::copy(startOfWorld, startOfWorld + length, result.begin())
添加的测试中显示)