AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 298118
Accepted
Tessaract
Tessaract
Asked: 2021-08-17 08:45:42 +0800 CST2021-08-17 08:45:42 +0800 CST 2021-08-17 08:45:42 +0800 CST

在桌子上插入异常缓慢

  • 772

我有一个“基本”定价层 Azure SQL 数据库,其中包含一个 7 列表、一个作为聚集索引和主键的 int ID 列、一个 datetime2(0) 列、3 个 varchar(100) 列和 2 个 varchar(MAX ) 列,都可以为空。

该表没有触发器、约束或外键。

现在我正在插入大量的测试数据,我正在做一个

INSERT INTO table_name (<all columns, except the ID one>)
values (<just some values, the ones for varchar(MAX) being 221 characters long>)`
GO 680000

但是查询已经运行了 5 个小时,只插入了 290000 行。

我试图找出原因。

performance azure-sql-database
  • 2 2 个回答
  • 710 Views

2 个回答

  • Voted
  1. Best Answer
    AMtwo
    2021-08-17T09:00:01+08:002021-08-17T09:00:01+08:00

    您需要查看执行插入的会话的等待情况,以确定瓶颈是什么。鉴于您处于“基本”层,您的插入可能会根据服务层被人为地限制。

    如果您运行这样的查询...

    SELECT *
    FROM sys.dm_exec_session_wait_stats
    WHERE session_id = <session doing the insert>
    ORDER BY wait_time_ms DESC
    

    ...我怀疑您会看到顶部等待可能类似于LOG_RATE_GOVERNORor HADR_THROTTLE_LOG_RATE_GOVERNOR。这些等待类型是由于人为限制写入 Azure SQL DB 中的事务日志的速率而引起的,并且是使用基本层时大型插入的常见瓶颈。基本层的可用系统资源极为有限。注意:有可能在不达到服务层的 DTU 限制的情况下达到日志速率限制。

    一种解决方案是简单地使用更高的服务层,这将允许您有更多的 DTU(因此更多的整体系统资源)用于您的大型插入。加载完成后,您可以切换回较低的服务层。我已经写了更多关于 DTU 的文章,并尝试将 DTU 与您可能更熟悉的传统本地硬件相关联——您可以在此处阅读。

    可能有更多选项可以提高较低服务层的吞吐量,但要做到这一点,您需要详细了解您正在做什么,以及您的资源瓶颈是什么。

    • 3
  2. Andrew Sayer
    2021-08-17T11:54:31+08:002021-08-17T11:54:31+08:00

    单行插入(尤其是在隐式提交之后)将生成比批量插入更多的事务日志数据。

    使用事务日志备份作为写入多少事务日志数据的粗略且现成的示例:

    CREATE TABLE new_employees  
    (  
     id_num int IDENTITY(1,1),  
     fname varchar (20),  
     minit char(1),  
     lname varchar(30),
     lob_col varchar(max)
    );  
    
    set nocount on 
    BACKUP LOG [demo_db] TO  DISK = N'V:\SQL\Backups\demo_db_log_clear.bak' WITH NOFORMAT, NOINIT,  NAME = N'demo_db-Full Database Backup', SKIP, NOREWIND, NOUNLOAD,  STATS = 10
    GO
    select getdate()
    go
    insert into new_employees  
    (  
     fname 
    ,minit 
    ,lname 
    ,lob_col 
    )
    values
    ('Andrew'
    ,'J'
    ,'Sayer'
    ,replicate('X',221)
    );
    go 100000
    select getdate()
    BACKUP LOG [demo_db] TO  DISK = N'V:\SQL\Backups\demo_db_log_single.bak' WITH NOFORMAT, NOINIT,  NAME = N'demo_db-Full Database Backup', SKIP, NOREWIND, NOUNLOAD,  STATS = 10
    GO
    select getdate()
    go
    insert into new_employees  
    (  
     fname 
    ,minit 
    ,lname 
    ,lob_col 
    )
    select top 100000
     'Andrew'
    ,'J'
    ,'Sayer'
    ,replicate('X',221)
    FROM sys.all_columns ac
    cross join sys.all_columns ac2
    go
    select getdate()
    go
    BACKUP LOG [demo_db] TO  DISK = N'V:\SQL\Backups\demo_db_log_bulk.bak' WITH NOFORMAT, NOINIT,  NAME = N'demo_db-Full Database Backup', SKIP, NOREWIND, NOUNLOAD,  STATS = 10
    GO
    

    (我正在使用 100,000 行,因为我不耐烦地等待单个值插入完成您的计数)。

    我家用机器上的结果:

    Single row insert
    Time taken: 2021-08-16 20:49:41.510 to 2021-08-16 20:50:04.477 = 23 seconds
    Transaction log backup size: 50010 pages
    
    Bulk row insert
    Time taken: 2021-08-16 20:50:04.787 to 2021-08-16 20:50:05.177 = 0.4 seconds
    Transaction log backup size: 4601 pages
    

    所以它大约快了 50 倍,并且生成了十分之一的事务日志数据。

    唯一要确保的是行生成源可以生成足够的行,我只是sys.all_columns与自身交叉连接,这在我相当空的数据库中产生了很多。

    • 1

相关问题

  • 使用存储过程处理数据与在检索后将其输入函数相比是否有性能提升?

  • 您如何针对繁重的 InnoDB 工作负载调整 MySQL?

  • 如何确定是否需要或需要索引

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve