AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / user-284726

Arokh's questions

Martin Hope
Arokh
Asked: 2024-06-13 18:32:19 +0800 CST

SqlBulkCopy 的内存使用率较高

  • 7

我已经开始使用 QueryStore 来监控我的应用程序,我注意到的一件事是,对于我以为的简单操作,内存使用量却出乎意料地高:

在此处输入图片描述

这意味着每次执行该语句时都会使用近 600MB 的 RAM?
该时间范围内每次执行的 RowCount 都远小于 100。该语句本身每 5 秒运行一次。

该表已分区并基于列存储索引,没有其他索引或主键/标识,并且有大约 750k 行:

CREATE TABLE [DataLink].[LogEntry](
  [AppInstanceId] [bigint] NOT NULL,
  [LoggedOnUtc] [datetime2](7) NOT NULL,
  [CategoryName] [nvarchar](256) NOT NULL,
  [EventCode] [int] NOT NULL,
  [EventName] [nvarchar](256) NULL,
  [LogLevel] [int] NOT NULL,
  [ScopeJson] [nvarchar](max) NULL,
  [StateJson] [nvarchar](max) NULL,
  [ExceptionJson] [nvarchar](max) NULL,
  [Message] [nvarchar](max) NULL
) ON [PSCH_Logging_DataLink_LogEntry_Daily7Of9]([LoggedOnUtc])

CREATE CLUSTERED COLUMNSTORE INDEX [CIX_LogEntry] 
ON [DataLink].[LogEntry] WITH (DROP_EXISTING = OFF, COMPRESSION_DELAY = 0, DATA_COMPRESSION = COLUMNSTORE) 
ON [PSCH_Logging_DataLink_LogEntry_Daily7Of9]([LoggedOnUtc])

触发插入的代码:

using var conn = connInfo.Main.GetConnection(DatabaseLoginType.User);
await conn.OpenAsync(ct).CAf();
using var sqlBulkCopy = new SqlBulkCopy((SqlConnection)conn, SqlBulkCopyOptions.CheckConstraints | SqlBulkCopyOptions.FireTriggers, null);

foreach(var toWriteItemGroup in toWriteItems.GroupBy(x => x.SchemaName)) {
...

    dataReader.Init(toWriteItemGroup, tableInfo.ColumnMappings.Length);

    sqlBulkCopy.DestinationTableName = $"{schemaName}.LogEntry";
    sqlBulkCopy.ColumnMappings.Clear();
    for(int i = 0; i < tableInfo.ColumnMappings.Length; i++) sqlBulkCopy.ColumnMappings.Add(i, tableInfo.ColumnMappings[i]);
    await sqlBulkCopy.WriteToServerAsync(dataReader, ct).CAf();
...
}

知道为什么内存使用率这么高以及我该怎么做才能解决这个问题?

编辑4
我通过更改和手动编译 Microsoft.Data.SqlClient 进行了一些测试。我所做的更改包括将 ROWS_PER_BATCH 和/或 KILOBYTES_PER_BATCH 添加到“insert bulk”语句的 with 选项中。所有选项都没有改变使用的内存量,但前者改变了行数估计:https://www.brentozar.com/pastetheplan/ ?id=HkKjc9HIC 似乎无法针对低行数优化“insert bulk”。

编辑3
这是一个简短的示例,我可以通过它重现该问题。
它包含一个脚本“Script.sql”,需要先执行该脚本来设置表并添加一些数据。之后使用“dotnet run”运行该程序(或使用 IDE)。
由于我无法在此处上传文件,因此我已将其上传到 github gist:https://gist.github.com/DvdKhl/d042ed05e3237136265295cb39ecb4f4

该脚本将:

  • 创建一个视图,显示表的 PartitionInfo
  • 创建(或重新创建)表及其配置
  • 插入 700k 行(每个分区 100k)
  • 重建索引
  • 输出分区信息
  • 注释掉的是
    • 事件会话(扩展事件)捕获查询计划
    • 另一个插入语句
    • 清理

该计划将:

  • 在“localhost”上为数据库“main”打开一个连接
  • 创建一个虚拟数据读取器(更改计数以更改插入的行数)
  • 像上面一样设置 SqlBulkCopy
  • 调用 WriteToServerAsync 插入行

这导致以下查询计划:https://www.brentozar.com/pastetheplan/? id=B1v_8bGLC

编辑2
按照 Denis Rubashkin 的建议我设置了 BatchSize 和顺序提示:

sqlBulkCopy.BatchSize = toWriteItemGroup.Count();
sqlBulkCopy.ColumnOrderHints.Add("LoggedOnUtc", SortOrder.Ascending);

BatchSize 似乎没有改变任何东西(估计值保持不变)。
看起来 ROWS_PER_BATCH 未被使用,尽管在代码中设置了 sqlBulkCopy.BatchSize,这可能是主要问题。

添加 Order 提示后,查询不会显示在 QueryStore 中。
但是使用扩展事件获取查询计划会显示“过度授权”警告。所以我不确定这是否有帮助。

KILOBYTES_PER_BATCH 选项看起来很有趣,但我似乎无法在 C# 代码中设置它。

WithOrderHint / WithoutOrderHint(不同的表,但问题完全相同)

编辑:
查询计划:https://www.brentozar.com/pastetheplan/? id=SJGpBktH0

表属性 - 存储
在此处输入图片描述

分区的磁盘使用情况
在此处输入图片描述

sql-server
  • 3 个回答
  • 213 Views
Martin Hope
Arokh
Asked: 2024-02-05 03:57:05 +0800 CST

审计直接对象访问(跳过间接访问)

  • 5

为了将内部表与第三方数据库访问隔离,我们专门针对该用例创建了模式。第三方登录/数据库用户只能访问那些“公共”模式。
问题在于用户拥有的权限超出了应有的权限,并且许多第三方查询访问内部表。
由于我不能突然删除权限,所以我想一点一点地删除。识别有问题的查询并相应地更改它们。

为此,我尝试使用 Sql Server 数据库审核功能,但看起来我缺少执行所需操作的信息:
可以说我有表[Internal].[Machine]和视图[Public].[Machine],为简单起见,它只是select * from [Internal].[Machine]. 用户viewer仅具有选择的权限[Public].[Machine]。

select * from [Internal].[Machine]为 (Type=SELECT、ObjectClass=SCHEMA、ObjectName=Internal、PrincipalName=viewer) 添加“数据库审核规范”,会生成和 的条目select * from [Public].[Machine]。
我的目标是只有一个条目select * from [Internal].[Machine],即当查询语句直接访问对象时。据我所知,生成的行不包含区分两者所需的信息。

这是否可以通过 Sql Server 审核/扩展事件功能(或其他功能)实现?

sql-server
  • 1 个回答
  • 86 Views
Martin Hope
Arokh
Asked: 2024-01-04 22:04:19 +0800 CST

将表分区切换为临时表

  • 5

我正在尝试使用以下查询将表分区切换为临时表:

create partition function [PFCT_T](datetime2) as range right for values ()
create partition scheme [PSCH_T] as partition [PFCT_T] all to ([primary])
    
create table T(A1 datetime2 not null, A2 int not null) on [PSCH_T](A1)
create clustered columnstore index [CIX_T] on dbo.T
    
insert into T(A1, A2) values ('2024-01-01 00:00:00', 1)
    
select top 0 * into #T from T
create clustered columnstore index [CIX_#T] on #T
    
alter table T switch partition 1 to #T
--Results in:
--Msg 608, Level 16, State 1, Line 15
--No catalog entry found for partition ID 5620492390548766720 in database 23. The metadata is inconsistent. Run DBCC CHECKDB to check for a metadata corruption.

是否无法将分区切换到临时表(它适用于普通表)或者我错过了什么?

partitioning
  • 1 个回答
  • 22 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve