AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 5766
Accepted
Rick James
Rick James
Asked: 2011-09-15 09:34:41 +0800 CST2011-09-15 09:34:41 +0800 CST 2011-09-15 09:34:41 +0800 CST

哈希索引何时变得合理?

  • 772

MySQL 本身不支持哈希索引。因此,制作一个伪散列列并在散列列上创建索引需要一些思考。

而且似乎被广泛理解的是,如果文本字段很长,那么哈希值就值得他们需要的开销。但是文本应该多长时间才能开始考虑哈希?

如果我打算使用 128 位散列,那么对于文本列来说,多少个字符阈值才是足够的最小值?

我的另一个问题中列出的编辑详细信息可能有用https://stackoverflow.com/questions/7403167/index-on-url-or-hashing-considering-ram

mysql performance
  • 3 3 个回答
  • 4332 Views

3 个回答

  • Voted
  1. Jonathan
    2011-09-15T09:53:54+08:002011-09-15T09:53:54+08:00

    我不确定您想要哈希索引的原因是什么。

    但是,如果您正在寻找索引 text/varchar 列,那么您可以使用 MyISAM/full-text,或者您可以使用外部的东西,如 Sphinx 或 Lucene。

    或者,您可以使用另一个列的散列版本创建一个附加列,只要它的 1000 字节或更少,那么它就可以被 MySQL 索引。

    我希望我已经回答了你的问题。

    • 3
  2. Best Answer
    Gary Lindahl
    2011-09-17T17:42:44+08:002011-09-17T17:42:44+08:00

    当它开始保存您的磁盘时,它开始变得合理。但与此同时,它开始占用您的计算能力。

    现在磁盘空间被认为很便宜,但如果您使用的是 SSD,那么它并不便宜。由于您需要完全匹配,因此它不会占用太多 CPU,因此它可能是一个更好的选择。

    您关于满足使用散列的文本列长度的问题的确切答案可能会根据从 DBA 加载系统的技能开始的许多因素而有所不同。

    但是,如果您使用哈希节省超过 50% 的 RAM,并且总 RAM 节省至少 2GB,那么我认为采取这条路线可能值得,否则可能是不必要的排练。

    • 3
  3. gview
    2011-09-15T19:58:45+08:002011-09-15T19:58:45+08:00

    阅读了您的描述后,我可以看到哈希是如何有意义的。但是,当您谈论内存时,使用索引列的大小并不意味着无法搜索大型数据集。mysql的基本索引技术是btree。Btree 分而治之。

    我可以给出的具体建议是:假设您将使用 md5() 哈希。为了获得最大效率,您应该将哈希作为 innodb 引擎表的主键,其中哈希是 char(32)。由于 innodb 具有聚集索引,因此检索数据将节省磁盘读取,并且当您使用 char 时需要完成的工作也减少了,因为 md5() 哈希的结果永远不会改变.

    • 0

相关问题

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve