AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 10840
Accepted
Dolan Antenucci
Dolan Antenucci
Asked: 2012-01-18 14:39:56 +0800 CST2012-01-18 14:39:56 +0800 CST 2012-01-18 14:39:56 +0800 CST

如何优化我的 mysql 设置以更快地创建索引?

  • 772

我有一台运行 Ubuntu 10.04 的服务器,通过包安装了 Mysql 5.1x。该系统有 128GB 内存,8 个内核,并有 4TB 的可用空间用于存储 Mysql 和 Mysql tmp。

我有一个这样的 MyISAM:

CREATE TABLE `data_store` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `uniqname` varchar(150) NOT NULL,
  `data` blob,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM CHARSET=latin1;

我插入了 8 亿条记录(插入前大约 350gb 数据),然后尝试添加以下索引:

ALTER TABLE data_store DISABLE KEYS;
ALTER TABLE data_store ADD INDEX uniqname_index (uniqname);
ALTER TABLE data_store ENABLE KEYS;

(关于DISABLE KEYS命令,我看到其他地方建议在插入数据之前使用,并且由于该命令从未到达ENABLE KEYS,我认为它对我没有任何用途。我主要只是在我对我的描述中包含了彻底的内容。我在做。)

当我启动索引作业时,显示的第一个状态SHOW PROCESSLIST是“正在复制到 tmp 表”。

几个小时后,我检查 bac,即使在 24 小时后,状态仍会显示在“Repair With Keycache”消息中。我尝试在稍旧的服务器上运行该作业,3 天后,它仍然保持“使用 keycache 修复”状态。因此,我取消了这台较新机器上的 create-index 命令。

我读过“使用 Keycache 修复”可能非常慢,在许多情况下,“通过排序修复”是首选。

基于一些 Stack Exchange 和网上的随机帖子,我在 Mysql 服务器中添加了以下设置:

myisam_sort_buffer_size = 80G
bulk_insert_buffer_size = 80G
myisam_repair_threads   = 8
max_heap_table_size     = 20G
myisam_max_sort_file_size = 500G
tmp_table_size          = 20G
key_buffer_size         = 20G
sort_buffer_size        = 20G
join_buffer_size        = 20G

我重新启动了作业,同样的过程再次发生(复制到 tmp 文件,然后通过密钥缓存修复)。

在我终止作业后,我注意到在 mysql/error.log 中有一条消息,“myisam_sort_buffer_size 太小”。这发生在当天早些时候,而不是我杀死工作的时候。

问题

  • 我会走错路吗?我只是希望能够通过某个键(uniqname)快速查找我的数据。

  • 从我的表开始,从头开始添加索引,使用DISABLE KEYS命令,插入我的 8 亿条记录,然后再开始,有什么好处ENABLE KEYS吗?我在其他地方读到这可以防止复制 tmp 表(这可能只能节省我几个小时?)

  • 我想要这个“通过排序修复”吗?

mysql index
  • 1 1 个回答
  • 9778 Views

1 个回答

  • Voted
  1. Best Answer
    RolandoMySQLDBA
    2012-01-18T15:53:12+08:002012-01-18T15:53:12+08:00

    对于初学者,我暂时不会触及缓冲区大小。您在问题中的尺寸太大了。

    这是另一个观察结果:您有 BLOB 数据。哎呀,您的临时表将很快占用空间。你可以这样做:

    通过将此行添加到 /etc/fstab 创建一个名为 /var/tmpfs 的 32GB RAM 磁盘

    none                    /var/tmpfs              tmpfs   defaults,size=32g        1 2
    

    接下来,创建一个名为 /mysqltmp 的文件夹并在其上挂载 RAM 磁盘

    mkdir /mysqltmp
    chown mysql:mysql /mysqltmp
    mount /mysqltmp /var/tmpfs
    

    将此添加到 my.cnf 并重新启动 mysql

    [mysqld]
    tmpdir=/mysqltmp
    

    现在,任何通过 DDL 生成的 tmp 表都会进入 RAM 磁盘。

    这是另一个观察结果:为什么不创建一个单独的表来使 BLOB 数据远离唯一名称?

    CREATE TABLE `data_store_name` SELECT id,uniqname FROM `data_store` WHERE 1=2;
    ALTER TABLE `data_store_name` ADD PRIMARY KEY (id);
    ALTER TABLE `data_store_name` ADD UNIQUE KEY (uniqname);
    ALTER TABLE `data_store_name` ADD INDEX name_id_ndx (uniqname,id);
    INSERT INTO `data_store_name` SELECT id,uniqname FROM `data_store`;
    

    这将防止在索引时移动 BLOB 数据。

    从这里开始,您必须始终使用它的名称加入 data_store,如下所示:

    SELECT
        A.uniqname,B.data
    FROM
        (SELECT * FROM data_store_name WHERE uniqname = 'mydataname') A
        LEFT JOIN
        data_store B USING (id)
    ;
    

    进行这些更改将避开处理 keycache、RAM 磁盘和 tmp 表的整个混乱局面。

    试试看 !!!

    • 6

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何查看 Oracle 中的数据库列表?

    • 8 个回答
  • Marko Smith

    mysql innodb_buffer_pool_size 应该有多大?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    从 .frm 和 .ibd 文件恢复表?

    • 10 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve