AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 37467
In Process
nategood
nategood
Asked: 2009-07-08 19:31:40 +0800 CST2009-07-08 19:31:40 +0800 CST 2009-07-08 19:31:40 +0800 CST

快速查询大型数据集:MySQL MEMORY (HEAP) 引擎、MyISAM 或其他东西(例如 MemCached)

  • 772

目前正在从事一个以称为 SNOMED 的医学词汇为中心的项目。snomed 的核心是一个(关系)数据集,长度为 350,000 个术语/记录。我们希望能够快速查询此数据集以获取我们希望具有某种形状或形式的自动完成/建议的数据输入部分。

它目前位于 MySQL MyISAM DB 中,仅用于开发目的,但我们想开始使用一些内存选项。目前包括索引在内是 30MB。MEMORY MySQL 引擎和 MemCached 是显而易见的,所以我的问题是您会建议其中哪一个,或者那里有更好的东西?如果这有所作为,我们主要在应用程序级别使用 Python。

旁注:数据集有一个单独的关系,将这些概念映射到大约 130 万条记录的常见别名和缩写......最终我们也希望在这里使用其中的一个子集。

performance mysql database memcached
  • 2 2 个回答
  • 1499 Views

2 个回答

  • Voted
  1. MarkR
    2009-07-08T23:29:21+08:002009-07-08T23:29:21+08:00

    目前尚不清楚您的具体要求是什么,但是对于这么小的数据库,查询在任何引擎上都可能很快,因为所有数据都可以放入内存中。

    MyISAM 和 InnoDB 之类的东西需要一些调整才能工作。Memcached 仅在您需要扩展到非常高负载的基于读取的工作负载时才有用,即那些对于单个服务器来说太高而无法从传统内存数据库中提供服务的工作负载(Memcached 的主要功能是能够跨池扩展)服务器)。但是 memcached 不能进行常规查询,例如范围扫描,只能查找特定键,因此它不是通用数据库。

    我建议使用 innodb 的缓冲池大于您的数据集,并正确选择主键。主键范围扫描应该执行得非常好,并且应该能够用于前缀匹配(例如完成用例)。

    在普通硬件上,您将能够扩展到每秒 1000 个查询。如果你需要更多,要么添加复制从属服务器,要么考虑使用 memcached 之类的东西。

    考虑在 StackOverflow 上提问?

    • 1
  2. Xorlev
    2009-10-23T22:05:07+08:002009-10-23T22:05:07+08:00

    您可以将表保留为 MEMORY 类型。它会非常快,但需要您在使用前播种。我有一种感觉,你可以从中获得很多性能。在内存中,它的读取操作肯定比 InnoDB 和 MyISAM 快。

    我会说尝试几种不同的方式,然后用 ApacheBench 超载搜索,看看什么在压力下最容易屈服。

    • 0

相关问题

  • IIS 6.0 (Windows Server 2003) 上的 HTTP 压缩

  • 在 Linux Xen VPS 上优化 Apache 和 MySQL

  • 如何选择 MySQL 数据库引擎

  • 上线的第一天:如何不杀死您的网站

  • IIS 优化

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve