AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / user-51214

Fastidious's questions

Martin Hope
Fastidious
Asked: 2016-01-17 07:22:53 +0800 CST

如何在大型事实表上索引字母数字外键?

  • 6

我有一个字段是一个字母数字字段,理想情况下是一个非唯一标识符的加密字段。它用于以多对多关系关联其他相当大的事实表。我没有此字段的相关维度,因为此 FK 没有其他属性。

示例:Abcdefgh12345

该字段位于一个相当大且不断增长的数据仓库中,其中事实表按时间聚集而不是像这样在键上聚集。

该列VARCHAR(50)仅在 45 到 50 之间变化。必须检查,但我假设排序规则是SQL_Latin1_General_CP1_CI_AS. 出于优化原因,我不使用 FK。全部由 ETL 控制。

碎片化

由于键的类型,很难索引。它的碎片是通过我最近进行的一系列测试来管理的,这些测试显示 75% 的填充因子至少可以通过减少每日增量负载的碎片至少一周直到可能需要完全重建,每周一次就可以了。

表现

随着填充因子从 100% 降低到 75%,插入和读取变得更慢。记录也如预期的那样变大了。任何带有 include 的索引都在很大程度上推动了插入的性能,但当然可以帮助需要它们的查询提高 10 倍。

问题

有没有人有在数据仓库环境中使用字母数字的良好经验?它的处理方式和索引现在很好,但我认为它可能会更好。我正在考虑在 ETL 过程中剥离密钥、形成新维度并添加更易于管理的密钥的想法。

sql-server data-warehouse
  • 1 个回答
  • 636 Views
Martin Hope
Fastidious
Asked: 2015-12-07 07:11:26 +0800 CST

在数据仓库的大型表上重建索引有哪些选项?

  • 1

我有一个批量加载过程,可以将数百万条记录加载到仓库中的几个事实表中。这些表主要按时间聚集。非聚集索引适用于如何使用数据来提高性能。

我通常会删除一些非聚集索引,以加快插入速度并减少大数据加载后的索引碎片。然而,随着数据的增长,这个删除和重建的过程会导致大量的时间。

示例:一个表用了 2 个小时在 1 亿多行上应用新的非聚集索引。

同样,如果我保留非聚集索引,它们会在某些情况下将插入量增加 3 到 10 倍,这会迫使您放弃并重建。

虽然删除和重建索引很棒,但随着这些表中数据的增长,它们并没有真正发挥作用。我可以使用哪些选项?我是否应该使用更多内存(目前为 32GB)和 CPU(4 个 vCPU)来扩容服务器?我应该重新考虑我的索引吗?我是否应该找到保留一些索引以进行重组与删除和重建之间的平衡?

(注意:我没有企业版。)

我在想我唯一的选择是带有表分区的企业版,我可以在其中重建每个分区的索引,而不是整个表。

index sql-server-2008-r2
  • 1 个回答
  • 187 Views
Martin Hope
Fastidious
Asked: 2015-11-21 14:32:03 +0800 CST

当您有多个 OLE DB 连接插入同一个表时,您需要表锁吗?

  • 0

SSIS 并不是我的强项。我注意到您在 OLE DB 目标上有一个表锁定选项,其中整个表在我假设的插入数据事务期间被锁定。

如果您有一个带有条件拆分的平面文件数据源,该数据源将数据解析为 5 个或更多 OLE DB 目标,这些目标以同一个表为目标且表锁定已打开,会发生什么情况?如果数据被快速加载(插入)到目标本身,每个 OLE DB 目标是否会在这种情况下相互阻塞?

我删除了实例中的表锁,一切似乎都很好。它以每分钟大约 100 万条记录的速度拆分数据并插入记录。

sql-server sql-server-2008-r2
  • 1 个回答
  • 1540 Views
Martin Hope
Fastidious
Asked: 2015-05-13 13:32:35 +0800 CST

SSDT-BI 可以与 SQL Server 2008 R2 一起使用吗?

  • 1

抱歉,如果这是多余的,但是由于工具的疯狂命名,很难找到问题的答案。

问题 1

使用 Microsoft SQL Server Data Tools - Business Intelligence (SSDT-BI) for Visual Studio 2013 构建的 SSIS 包、报告等是否可以在 SQL Server 2008 R2 上运行?

问题2

我目前正在使用适用于 Microsoft Visual Studio 2008 的 SQL Server Business Intelligence Development Studio (BIDS)。我想升级到 Data Tools - 适用于 Visual Studio 2013 的商业智能。

我假设我需要 A) 购买 Visual Studio 2013 的新副本,然后 B) 下载免费的 SSDT-BI 软件?这是假设 VS2013 的 SSDT-BI 适用于 2008 R2。

sql-server sql-server-2008-r2
  • 1 个回答
  • 3496 Views
Martin Hope
Fastidious
Asked: 2015-03-06 05:55:16 +0800 CST

更新大表的更多最佳实践?

  • 3

我知道这个问题有很多主题,但我一直在寻求更多的见解。

我有一个包含十亿多条记录的大表。记录的数量可以减少和存档,但大小仍然很大。我的任务是更改单个列的现有数据类型,其中旧数据值可以安全地转换为类型。

以下是我的一些方法:

1 - 删除影响目标列的表约束,删除也影响目标列的索引,在表末尾添加一个带有 NULL 的新列,用 10K 块的旧列值更新新列, 50K 或 100K 增量,在复制数据后删除旧列并仅为该列重新应用索引。

2 - 将所有数据复制到新表中,数据类型像以前一样以块的形式更改,验证数据是否完成,删除旧表,将新表重命名为旧表并应用索引。

3 - 使用 BULK INSERT 和 MERGE SP 将来自另一个数据源(如平面文件)的所有数据导入到新表中,数据类型发生变化,基本上类似于选项 2,有 2 个重复表,验证数据,删除旧表以替换为新表和应用索引。

什么是最快和最安全的选择?还有其他我没有考虑的选择吗?我已经使用选项 1 很好地更新了其他表的 1 亿条记录。表越大,由于更新的持续时间,选项 1 变得越难。

sql-server sql-server-2008-r2
  • 1 个回答
  • 3775 Views
Martin Hope
Fastidious
Asked: 2015-01-24 12:42:29 +0800 CST

如何在 SSRS 报告中传递多值字符?

  • 8

我有一份 SSRS 报告,其中有 3 个数据集来自一个数据源。主数据集是一个存储过程,它基于由其他两个数据集提供支持的一组参数聚合一些数据。

支持此报告的主要存储过程有 4 个参数。一个是数据类型的 ID,两个是开始和结束日期,第三个只是一个标志参数。flag 参数是多值参数,我想在其中传递多个也是 VARCHAR 值的标志值。

在我的 @Flag 参数的存储过程中,我有一个共同点:

WHERE [Flag] IN (@Flag)

当然,SSRS 报告上的@Flag 参数设置为允许“多个值”,这些值也是从从维度表中提取这些@Flag 值的查询中填充的。

我的问题

在大多数情况下,在处理 INT 值时,使用相同的技术是可行的。但是,当我处理字符值时,它失败了。如果我选择一个标志,报告就会神奇地起作用。如果我选择了多个标志,它似乎没有将标志正确地传递给存储过程并且没有结果返回。

在存储过程中直接测试多值标志时:

WHERE [Flag] IN ('A', 'B', 'C')

存储过程正常工作。所以问题不在于存储过程,而在于 SSRS 如何将多值值传递给 @Flag 参数。

尝试过的解决方案

我尝试对此@Flag 参数的SSRS 数据集进行以下调整:

=join(Parameters!<your param name>.Value,",")

还有这个:

=SPLIT(JOIN(Parameters!<your param name>.Value,","),",")

这些都适用于单值,但从不适用于多值。

我在这里想念什么?

sql-server ssrs
  • 1 个回答
  • 36779 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve