Arokh提出的问题 -dba

Arokh

Asked: 2024-06-13 18:32:19 +0800 CST

SqlBulkCopy 的内存使用率较高

7

我已经开始使用 QueryStore 来监控我的应用程序，我注意到的一件事是，对于我以为的简单操作，内存使用量却出乎意料地高：

这意味着每次执行该语句时都会使用近 600MB 的 RAM？
该时间范围内每次执行的 RowCount 都远小于 100。该语句本身每 5 秒运行一次。

该表已分区并基于列存储索引，没有其他索引或主键/标识，并且有大约 750k 行：

CREATE TABLE [DataLink].[LogEntry](
  [AppInstanceId] [bigint] NOT NULL,
  [LoggedOnUtc] [datetime2](7) NOT NULL,
  [CategoryName] [nvarchar](256) NOT NULL,
  [EventCode] [int] NOT NULL,
  [EventName] [nvarchar](256) NULL,
  [LogLevel] [int] NOT NULL,
  [ScopeJson] [nvarchar](max) NULL,
  [StateJson] [nvarchar](max) NULL,
  [ExceptionJson] [nvarchar](max) NULL,
  [Message] [nvarchar](max) NULL
) ON [PSCH_Logging_DataLink_LogEntry_Daily7Of9]([LoggedOnUtc])

CREATE CLUSTERED COLUMNSTORE INDEX [CIX_LogEntry] 
ON [DataLink].[LogEntry] WITH (DROP_EXISTING = OFF, COMPRESSION_DELAY = 0, DATA_COMPRESSION = COLUMNSTORE) 
ON [PSCH_Logging_DataLink_LogEntry_Daily7Of9]([LoggedOnUtc])

触发插入的代码：

using var conn = connInfo.Main.GetConnection(DatabaseLoginType.User);
await conn.OpenAsync(ct).CAf();
using var sqlBulkCopy = new SqlBulkCopy((SqlConnection)conn, SqlBulkCopyOptions.CheckConstraints | SqlBulkCopyOptions.FireTriggers, null);

foreach(var toWriteItemGroup in toWriteItems.GroupBy(x => x.SchemaName)) {
...

    dataReader.Init(toWriteItemGroup, tableInfo.ColumnMappings.Length);

    sqlBulkCopy.DestinationTableName = $"{schemaName}.LogEntry";
    sqlBulkCopy.ColumnMappings.Clear();
    for(int i = 0; i < tableInfo.ColumnMappings.Length; i++) sqlBulkCopy.ColumnMappings.Add(i, tableInfo.ColumnMappings[i]);
    await sqlBulkCopy.WriteToServerAsync(dataReader, ct).CAf();
...
}

知道为什么内存使用率这么高以及我该怎么做才能解决这个问题？

编辑4
我通过更改和手动编译 Microsoft.Data.SqlClient 进行了一些测试。我所做的更改包括将 ROWS_PER_BATCH 和/或 KILOBYTES_PER_BATCH 添加到“insert bulk”语句的 with 选项中。所有选项都没有改变使用的内存量，但前者改变了行数估计：https://www.brentozar.com/pastetheplan/ ?id=HkKjc9HIC 似乎无法针对低行数优化“insert bulk”。

编辑3
这是一个简短的示例，我可以通过它重现该问题。
它包含一个脚本“Script.sql”，需要先执行该脚本来设置表并添加一些数据。之后使用“dotnet run”运行该程序（或使用 IDE）。
由于我无法在此处上传文件，因此我已将其上传到 github gist：https://gist.github.com/DvdKhl/d042ed05e3237136265295cb39ecb4f4

该脚本将：

创建一个视图，显示表的 PartitionInfo
创建（或重新创建）表及其配置
插入 700k 行（每个分区 100k）
重建索引
输出分区信息
注释掉的是
- 事件会话（扩展事件）捕获查询计划
- 另一个插入语句
- 清理

该计划将：

在“localhost”上为数据库“main”打开一个连接
创建一个虚拟数据读取器（更改计数以更改插入的行数）
像上面一样设置 SqlBulkCopy
调用 WriteToServerAsync 插入行

这导致以下查询计划：https://www.brentozar.com/pastetheplan/? id=B1v_8bGLC

编辑2
按照 Denis Rubashkin 的建议我设置了 BatchSize 和顺序提示：

sqlBulkCopy.BatchSize = toWriteItemGroup.Count();
sqlBulkCopy.ColumnOrderHints.Add("LoggedOnUtc", SortOrder.Ascending);

BatchSize 似乎没有改变任何东西（估计值保持不变）。
看起来 ROWS_PER_BATCH 未被使用，尽管在代码中设置了 sqlBulkCopy.BatchSize，这可能是主要问题。

添加 Order 提示后，查询不会显示在 QueryStore 中。
但是使用扩展事件获取查询计划会显示“过度授权”警告。所以我不确定这是否有帮助。

KILOBYTES_PER_BATCH 选项看起来很有趣，但我似乎无法在 C# 代码中设置它。

WithOrderHint / WithoutOrderHint（不同的表，但问题完全相同）

编辑：
查询计划：https://www.brentozar.com/pastetheplan/? id=SJGpBktH0

表属性 - 存储

分区的磁盘使用情况

Arokh

Asked: 2024-02-05 03:57:05 +0800 CST

审计直接对象访问（跳过间接访问）

5

为了将内部表与第三方数据库访问隔离，我们专门针对该用例创建了模式。第三方登录/数据库用户只能访问那些“公共”模式。
问题在于用户拥有的权限超出了应有的权限，并且许多第三方查询访问内部表。
由于我不能突然删除权限，所以我想一点一点地删除。识别有问题的查询并相应地更改它们。

为此，我尝试使用 Sql Server 数据库审核功能，但看起来我缺少执行所需操作的信息：
可以说我有表[Internal].[Machine]和视图[Public].[Machine]，为简单起见，它只是select * from [Internal].[Machine]. 用户viewer仅具有选择的权限[Public].[Machine]。

select * from [Internal].[Machine]为 (Type=SELECT、ObjectClass=SCHEMA、ObjectName=Internal、PrincipalName=viewer) 添加“数据库审核规范”，会生成和的条目select * from [Public].[Machine]。
我的目标是只有一个条目select * from [Internal].[Machine]，即当查询语句直接访问对象时。据我所知，生成的行不包含区分两者所需的信息。

这是否可以通过 Sql Server 审核/扩展事件功能（或其他功能）实现？

Arokh

Asked: 2024-01-04 22:04:19 +0800 CST

将表分区切换为临时表

5

我正在尝试使用以下查询将表分区切换为临时表：

create partition function [PFCT_T](datetime2) as range right for values ()
create partition scheme [PSCH_T] as partition [PFCT_T] all to ([primary])
    
create table T(A1 datetime2 not null, A2 int not null) on [PSCH_T](A1)
create clustered columnstore index [CIX_T] on dbo.T
    
insert into T(A1, A2) values ('2024-01-01 00:00:00', 1)
    
select top 0 * into #T from T
create clustered columnstore index [CIX_#T] on #T
    
alter table T switch partition 1 to #T
--Results in:
--Msg 608, Level 16, State 1, Line 15
--No catalog entry found for partition ID 5620492390548766720 in database 23. The metadata is inconsistent. Run DBCC CHECKDB to check for a metadata corruption.

是否无法将分区切换到临时表（它适用于普通表）或者我错过了什么？

SqlBulkCopy 的内存使用率较高

审计直接对象访问（跳过间接访问）

将表分区切换为临时表

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

Arokh's questions