作为开始:这是针对序列化的 ETL 存储过程,因此不关心并行性。
我需要在加载期间为标记分配自定义 ID 号。我不能使用身份字段,因为 ID 号是唯一的“桶号”——本质上是另一个编号字段。
我目前使用以下代码:
DECLARE @idRunner smallint
SELECT @idRunner = ISNULL(MAX([Id]),0)
FROM sim.[Variable]
WHERE [BucketRef] = @simBucketNo
DECLARE variable_cursor CURSOR FOR
SELECT DISTINCT p.[Variable]
FROM simstg.[Parameter] p
LEFT OUTER JOIN sim.[Variable] v ON (p.[Variable] = v.[Code])
WHERE p.[BucketRef] = @stgBucketNo
AND v.BucketRef = @simBucketNo
AND v.Code IS NULL
OPEN variable_cursor
DECLARE @variable VARCHAR(64)
FETCH NEXT FROM variable_cursor INTO @variable
WHILE @@FETCH_STATUS = 0
BEGIN
SET @idRunner = @idRunner + 1
INSERT INTO sim.[Variable] ([BucketRef], [VariableNo], [Code])
VALUES (@simBucketNo, @idRunner, @variable)
FETCH NEXT FROM variable_cursor INTO @variable
END
CLOSE variable_cursor
DEALLOCATE variable_cursor
我不喜欢它。它使用我更愿意避免的游标。(旁注:此代码未经测试)
有没有办法在没有光标的情况下更有效地做到这一点?添加新元素时,IR 数必须从使用的最高数开始增加。存在多个存储桶(按存储桶编号)并有自己的编号。
我总是一次只处理一个桶的数据(一个桶在 sim 中,一个在 simstg 中)。