AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 68455
Accepted
Luan Huynh
Luan Huynh
Asked: 2014-06-18 19:27:35 +0800 CST2014-06-18 19:27:35 +0800 CST 2014-06-18 19:27:35 +0800 CST

pg_column_size(table.*) 和 pg_column_size(table.col1) + pg_column_size (table.col2) 的区别

  • 772

来自PG DOC

pg_column_size(any) :用于存储特定值的字节数(可能已压缩) pg_column_size 显示用于存储任何单个数据值的空间

例子:

select pg_column_size(5::smallint);    -- 2 bytes 
select pg_column_size(5::int);         -- 4 bytes 

使用 pg_column_size 的输入,它可以是列或行,所以我创建了一个测试来检查它。这是我的测试:

我的桌子

CREATE TABLE index_test
(
  id integer NOT NULL,  -- 4  bytes 
  a integer,            -- 4  bytes 
  b integer,            -- 4  bytes 
  CONSTRAINT index_test_id PRIMARY KEY (id)
)

1/ 第一个查询: sum(pg_column_size(table.rows))

with abc as 
(
 select id,a,b
 from index_test where b > 100
)
select pg_size_pretty(sum(pg_column_size(abc.*))) from abc  -- "348 kB", abc.* = record

和查询的解释:

"Aggregate  (cost=427.55..427.56 rows=1 width=24) (actual time=9.171..9.171 rows=1 loops=1)"
"  CTE abc"
"    ->  Seq Scan on index_test  (cost=0.00..180.00 rows=9902 width=12) (actual time=0.039..2.882 rows=9902 loops=1)"
"          Filter: (b > 100)"
"  ->  CTE Scan on abc  (cost=0.00..198.04 rows=9902 width=24) (actual time=0.047..7.151 rows=9902 loops=1)"
"Total runtime: 9.376 ms"

2/ 第二个查询: sum(pg_column_size(table.id)) + sum(pg_column_size(table.a)) + sum(pg_column_size(table.b))

with abc as 
(
 select id, a, b 
 from index_test where b > 100
)
select  pg_size_pretty((sum(pg_column_size(id)))  + (sum(pg_column_size(b))) + (sum(pg_column_size(a))))
from abc  -- "116 kB"

和查询的解释:

"Aggregate  (cost=526.57..526.59 rows=1 width=12) (actual time=10.959..10.959 rows=1 loops=1)"
"  CTE abc"
"    ->  Seq Scan on index_test  (cost=0.00..180.00 rows=9902 width=12) (actual time=0.035..2.780 rows=9902 loops=1)"
"          Filter: (b > 100)"
"  ->  CTE Scan on abc  (cost=0.00..198.04 rows=9902 width=12) (actual time=0.039..5.623 rows=9902 loops=1)"
"Total runtime: 11.173 ms"

3/ 结果:

第一个查询:348 KB

第二个查询:116 KB ( pg_column_size(id) = 39 KB ...)

我认为两个查询都必须返回相同的结果,但是第一个查询的大小 = 3 * 第二个查询的大小,这让我感到困惑。在第一个解释中,“宽度 = 24 字节/行”(而不是 12),我想知道它为什么会增加,我认为这是问题的线索。到目前为止,我无法找到我的问题的明确答案,请帮助我。

postgresql
  • 1 1 个回答
  • 14218 Views

1 个回答

  • Voted
  1. Best Answer
    dezso
    2014-06-19T00:43:18+08:002014-06-19T00:43:18+08:00

    24 字节/行的差异敲响了警钟:它与表和索引中的行标题大小相同。直到您提出问题,我才意识到相同的标题大小显然适用于您在查询中返回的每一行:

    SELECT pg_column_size((1::integer, 2::smallint));
     pg_column_size 
    ────────────────
                 30
    

    但

    SELECT pg_column_size(1::integer) + pg_column_size(1::smallint) AS pg_column_size;
     pg_column_size 
    ────────────────
                  6
    

    将行传递给 时pg_column_size(),它会计算整行的大小,包括标题。

    现在进一步玩这个,你可以找到一些有趣的事实。

    例如,可以检查将列填充到最接近的 4 个字节(其中 k 是正整数)引起的差异:

    SELECT pg_column_size((1::smallint, 2::integer));
     pg_column_size 
    ────────────────
                 32
    

    这里我们比第一个例子多了两个字节,smallint 之后剩下的 2 个字节被“浪费”了。这在选择大表中的列顺序时可能很重要——例如,我们可以将一些东西挤进那个“空白”空间:

    SELECT pg_column_size((1::smallint, FALSE, FALSE, 2::integer));
     pg_column_size 
    ────────────────
                 32
    

    另一个重要的事情是,具有 NULL 作为值的列在这里的大小为零:

    SELECT pg_column_size((NULL::smallint, 2::integer));
     pg_column_size 
    ────────────────
                 28
    

    相反,当您尝试单独添加列时,您会得到 NULL:

    SELECT pg_column_size(NULL::smallint) +  pg_column_size(2::integer) AS pg_column_size;
     pg_column_size 
    ────────────────
               NULL
    
    • 12

相关问题

  • 我可以在使用数据库后激活 PITR 吗?

  • 运行时间偏移延迟复制的最佳实践

  • 存储过程可以防止 SQL 注入吗?

  • PostgreSQL 中 UniProt 的生物序列

  • PostgreSQL 9.0 Replication 和 Slony-I 有什么区别?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve