AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 157351
Accepted
Jason
Jason
Asked: 2016-12-07 06:33:41 +0800 CST2016-12-07 06:33:41 +0800 CST 2016-12-07 06:33:41 +0800 CST

为什么导入的txt表格占用空间那么大

  • 772

我有一个.txt存储大小为 1253 MB 的文件。将其导入 SQL Server 2016 后,该表占用磁盘空间 1680 MB。为什么存储空间会增长这么多?

我没有做任何数据转换,使用纯char格式存储数据。我读取txt文件的数据字典,如果变量的长度最多n,那么我使用varchar(3). 如果文件是固定长度的n,那么我使用char(n).

大约有 4 到 5 列是密集填充的,而所有其他列都非常稀疏。对于稀疏列,只有 1% 的行不为空。

这是创建表和导入数据的代码:

CREATE TABLE table1 (
var1 char(12),      var2 char(6),      var3 varchar(12),       var4 varchar(3),
var5 varchar(3),    var6 varchar(4),   var7 char(1),           var8 char(1),
var9 char(2),       var10 char(6),     var11     varchar(8),   var12 varchar(12),
var13 char(6),      var14 varchar(12), var15 varchar(14),var16 varchar(12),
var17 varchar(12),  var18 varchar(12), var19 varchar(12),var20 varchar(12),
var21 varchar(12),  var22 varchar(12));

如何减少存储空间?

这是来自命令的存储信息sp_spaced:

名称表 1
行 22260960
保留 1721240 KB
数据 1721128 KB
index_size 24 KB
未使用 88 KB
sql-server
  • 3 3 个回答
  • 116 Views

3 个回答

  • Voted
  1. Best Answer
    Joe Obbish
    2016-12-07T17:48:33+08:002016-12-07T17:48:33+08:00

    SQL Server 中的列存在元数据存储开销,您不必在平面文件中为此付费。使用压缩可以减少这种开销。从行压缩实现:

    它减少了与记录关联的元数据开销。此元数据是有关列、它们的长度和偏移量的信息。在某些情况下,元数据开销可能大于旧存储格式。

    尝试使用行或页压缩来压缩您的表,看看这是否会减少 SQL Server 中所需的空间。

    ALTER TABLE table1 REBUILD WITH (DATA_COMPRESSION = ROW);
    

    根据我的经验,压缩既可以提高也可以降低查询性能。这取决于您正在运行的数据和查询。您可能需要在空间和查询性能之间做出权衡。

    • 3
  2. Paul White
    2016-12-17T22:11:14+08:002016-12-17T22:11:14+08:00

    大约有 4 到 5 列是密集填充的,而所有其他列都非常稀疏。

    探索的另一个选择是使用SPARSE列。请参阅文档中的使用稀疏列。请注意,稀疏列与数据压缩(和列存储)不兼容。

    如何减少存储空间?

    除了 Joe Obbish 的回答中提到的行和页面压缩选项外,在 SQL Server 2016 中,您还可以使用集群列存储存储。这通常比页面压缩更能减少存储空间,尤其是在使用存档压缩的情况下。

    请参阅文档中的列存储索引指南和使用列存储和列存储存档压缩。

    列存储表和索引始终使用列存储压缩进行存储。您可以通过配置称为存档压缩的附加压缩来进一步减小列存储数据的大小。为执行归档压缩,SQL Server 对数据运行 Microsoft XPRESS 压缩算法。

    • 1
  3. tim_harkin
    2016-12-07T07:15:34+08:002016-12-07T07:15:34+08:00

    导入了多少条记录?确定需要多少存储空间应该相对简单。每个都char(n)需要n字节,每个都varchar(n)需要(2+输入数据的实际长度)个字节。

    请参阅产品文档中的char 和 varchar (Transact-SQL)。

    • 0

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve