AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 111584
Accepted
MacGyver
MacGyver
Asked: 2015-08-20 08:33:59 +0800 CST2015-08-20 08:33:59 +0800 CST 2015-08-20 08:33:59 +0800 CST

如何在 Informatica 中为 Netezza 作为源和 SQL Server 作为目标提高 ETL 性能?

  • 772

可以更改 Informatica 服务器、Informatica 软件本身或数据库服务器上的哪些设置或配置以增加 Informatica ETL 吞吐量?我们可以设置哪些基准来解决性能问题?我们专门使用 Netezza 作为源和 SQL Server 作为目标。

请从这个问题中排除多线程和 Informatica 分区。

这是我们过去做过的:

  • 每隔一段时间重新启动服务器
  • 在 ETL 加载之前删除 SQL Server 中目标表上的索引
  • 提高提交级别
sql-server netezza
  • 2 2 个回答
  • 3009 Views

2 个回答

  • Voted
  1. Lars G Olsen
    2016-03-14T02:24:32+08:002016-03-14T02:24:32+08:00

    我使用 Informatica 访问 SQL Server 和 Netezza 的经验可以总结为:

    1. 读取速度同样快(100,000 行/秒;有时是速度的两倍),前提是选择 SQL 足够简单,即:

      • 没有连接;

      • 不group by;

      • 没有排序;

      • where子句仅针对 SQL Server 表的群集键。

      在所有其他情况下,Netezza 将击败 SQL Server。

    2. 带有 PowerCenter 的插入属于这种array类型,SQL Server 通常每秒可以接收 2000 到 4000 行。

      如果 PowerCenter 不是瓶颈,则插入 Netezza 的速度为每秒 80,000 到 200,000 行。

    3. 多年来,使用 PowerCenter 的更新/删除在所有数据库上的速度都非常缓慢,因为执行的 SQL 是singletons而不是array. 因此,以 SQL Server 为目标的会话通常下降到每秒约 500 行,而以 Netezza 为目标的会话通常下降到每秒 8 行。

      因此,我们在 Netezza 中为每个 PowerCenter 目标定义了临时表,并在会话执行时将所有更新/删除写入这些表。然后将这些更改作为target post SQL. 这可以很好地扩展,因为现在所有写入操作都以与插入相似的速度运行。

    以 SQL Server 作为目标而臭名昭著的写入器瓶颈的最佳解决方案是在 PowerCenter 中花费大量时间比较源与目标,并且只写入您检测到的任何差异。这将带你走很长的路,但不是规模。

    我的最后一个问题是,为什么要将数据从 Netezza 移动到 SQLserver?如果您的企业有在 Netezza 上确实无法满足的要求,请说明哪些要求,也许可以解决。

    • 2
  2. Best Answer
    r.m
    2015-09-13T13:37:34+08:002015-09-13T13:37:34+08:00

    如果 powercenter informatica 是瓶颈(而不是 netezza、sql server 或网络),那么 powercenter Session 中的设置可能会有所帮助。IIRC 它是“记录缓冲区大小”或类似的东西。将其从默认更改为 512MB。如果这有帮助,最好通过尝试较低的值将其减少到更合理的值。

    此设置不是用于在内存中保存单个记录的大小,但它至少需要足够大以容纳其中的一条记录。内置帮助在这一点上有点含糊。

    在相反的情况下(SQL Server -> Netezza),我注意到数据类型也可以发挥作用。如果源表布局包含 LONG/NTEXT/VARBINARY 数据类型,powercenter 可能会严重高估它需要为单个记录保留的内存量。Netezza 没有这些,但如果目标包含大字段,它可能也很重要。

    powercenter 会话日志文件应该包含一些关于它保留多少内存来传输数据的信息。如果它太低,它可能成为瓶颈。

    • 1

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve