AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 9791
Accepted
tarnfeld
tarnfeld
Asked: 2011-12-28 15:43:27 +0800 CST2011-12-28 15:43:27 +0800 CST 2011-12-28 15:43:27 +0800 CST

MySQL 分片表/服务器或其他减少表大小的方法?

  • 772

我目前正在处理一个超过 1200 万行的表(使用 导出时大约 3 GB mysqldump)并且很好奇一个表实际上可以得到多大而不会对性能产生任何严重影响。该表每天大约增长 100,000-200,000 行。

在数据变得更大之前,我现在是否应该开始考虑将这些数据跨多个表或 mysql 实例进行分片?目前运行它的服务器有 1 GB 的内存(尽管它很快就会转移到 3/4 GB 的机器上)。

有没有人有任何提示/推荐阅读可以将我推向正确的方向,或者这是我还不需要担心的事情?

谢谢 :)

mysql scalability
  • 2 2 个回答
  • 848 Views

2 个回答

  • Voted
  1. Best Answer
    alex
    2011-12-29T02:14:48+08:002011-12-29T02:14:48+08:00

    一个好的 RDBMS 可以增长以容纳极大的数据。3Gb 数据库非常易于管理,而且很有可能,只要您可以获得具有足够 RAM 的服务器,大多数查询将运行得非常快而毫不费力。

    即使当您超出 RAM、索引、缓存和分区时,您仍然可以表现出色。通常,应用程序访问大多数相对较小的工作集——例如,90% 的查询可能仅限于上个月的数据——而 10% 可能是对较旧数据的查询。“上个月”的数据趋于稳定——当你有更多的用户时它会增长,但除此之外,它不会随着时间的推移而增长。这个“工作集”通常适合 RAM,被缓存并且您仍然可以获得出色的性能。

    但是随后,您可能会再次变慢。通过适当的监控和分析,您可以找到运行缓慢的查询并采取措施解决它们。

    这通常很简单:

    • 查询或不正确的代码:我们经常编写查询来检索不需要的信息,或者在一个查询就足够并且速度更快时执行多个查询(典型情况是需要显示表的 n 行并在 1 时执行 n 个查询的操作就足够了。在数据库外执行聚合也很频繁)。这很容易通过更改代码来解决
    • 无法高效运行的查询。EXPLAIN是你的朋友。通常,创建查询可以使用的索引就足够了(粗略地说,您需要在出现在WHERE子句中的列上建立索引)。此外,有时调整查询本身会产生好的结果

    另一种产生良好效果的方法是使用硬件解决问题:

    • 购买更多内存
    • 获得更多更好的磁盘(如果添加更多磁盘,RAID10 设置会更快,SSD 通常具有显着优势等)
    • 它不常见,但有时 CPU 是你的瓶颈——你可以获得更快的处理器和更多的内核/处理器

    在其他一些情况下,复制和分片可能是个问题。复制很复杂,但诸如 Oracle RAC 之类的东西可以让你构建怪物集群(有代价)。分片是另一种选择,但它通常是实施起来最复杂的选择之一——即使是很容易分片的应用程序也需要大量工作才能分片,而且一些应用程序可能非常难以分片。

    • 2
  2. Liran Zelkha
    2011-12-28T21:29:51+08:002011-12-28T21:29:51+08:00

    我认为您的数据库访问磁盘的那一刻 - 您的性能会下降,因此您需要确保您的机器具有比数据库大小更多的 RAM。适合您的解决方案是分区或分片(对于分片,请查看http://www.scalebase.com - 他们进行透明分片,因此毫不费力)

    • -2

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve