AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 58155
Accepted
Andremoniy
Andremoniy
Asked: 2014-02-04 09:11:03 +0800 CST2014-02-04 09:11:03 +0800 CST 2014-02-04 09:11:03 +0800 CST

针对大量 INSERTS 和 bytea 更新优化 PostgreSQL

  • 772

我们拥有的(软件):

  • PostrgeSQL 9.3与基本配置(没有变化postgresql.conf)
  • 视窗 7 64 位

硬件:

  • 英特尔酷睿 i7-3770 3.9 Ghz
  • 32 Gb 内存
  • WDC WD10EZRX-00L4HBAta 硬盘 (1000Gb, SATA III)

所以,我们必须加载到 DB aprox 中。带有bytea列的100.000.000行,以及更简单的500.000.000行(没有 LOB)。第一个表上有 2 个索引(长度为 13、19) ,第二个表上有 2 个索引(长度为 18、10)。每个表还有用于 id 生成的序列。varcharvarchar

到目前为止,这些操作使用 8 个并行连接和 50 个 JDBC 批处理大小进行。postgresql下图展示了系统负载:它是进程的零负载。加载 24 小时后,我们只加载了 10.000.000 行,结果非常慢。

在此处输入图像描述

PostrgreSQL我们在调整配置方面寻求帮助,目的是:

1)超快速加载这么多数据,是一次操作,所以可以临时配置

2) 对于生产模式,通过它们的索引对这两个表进行中等数量的 SELECT,而不进行连接和排序。

postgresql-9.3 insert
  • 1 1 个回答
  • 40525 Views

1 个回答

  • Voted
  1. Best Answer
    Craig Ringer
    2014-02-04T17:07:59+08:002014-02-04T17:07:59+08:00

    有关insert性能,请参阅加速 PostgreSQL 中的插入性能和 PostgreSQL 中的批量插入。

    您在为insert. PgJDBC 对批处理没有任何用处insert,它只是运行每个语句。<-- 这在新的 PgJDBC 版本中不再适用,它现在可以批处理准备好的语句以显着减少往返时间。但最好还是:

    改为使用COPY;请参阅PgJDBC 批量复制和CopyManager. 至于并发加载器的数量:如果操作受磁盘 I/O 限制,则目标是每个磁盘一对。八可能是你最想要的。

    对于您的“生产模式”,我建议加载一个数据样本,设置您希望运行的查询,并使用explain analyze它来调查性能。仅出于测试目的,使用enable_参数来探索不同的计划选择。为您的系统适当地设置查询计划器成本参数(random_page_cost、seq_page_cost、effective_cache_size等),并确保shared_buffers设置得当。在添加模拟生产工作负载时继续监控,使用auto_explain模块、log_min_duration_statement设置、pg_stat_statements扩展等。

    有关详细信息,请参阅 PostgreSQL 用户手册。explain analyze当您在查询执行细节等方面遇到更具体的问题时,我建议您回到这里。

    • 14

相关问题

  • 如何从 PostgreSQL 中的选择查询中将值插入表中?

  • 插入到 Oracle 数据库表中的特定位置?

  • 在 INSERT 中嵌套 SELECT

  • 当我尝试插入多于 1 行时出现“ORA-00911”错误

  • 我怎么知道为什么在某个表上插入很慢?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve