AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 241784
Accepted
PeterJ
PeterJ
Asked: 2019-07-02 04:45:30 +0800 CST2019-07-02 04:45:30 +0800 CST 2019-07-02 04:45:30 +0800 CST

查找可能已更改其数据类型以减小大小的整数数据库列

  • 772

我有一个继承的数据库模式,其中所有整数列都被定义为,int但由于业务规则,许多数据类型可以替换为tinyiny需要较少存储的其他数据类型。虽然我不期望通过使用较小的类型来提高性能,但我想要这样做的原因是:

  • 该应用程序使用 SQL Server Express,因此我想在需要清除数据之前充分利用 10GB 的数据库大小。

  • 该应用程序附带数据库的完整初始副本,并且使用 Microsoft Sync Framework 同步更新。一些客户端 PC 的 Internet 连接速度相对较慢,因此数据库越小越好。

我想知道是否有某种方法可以快速识别可能“过大”的列?我意识到需要仔细检查结果,以确保该列永远不会超过新数据类型的限制。

sql-server database-size
  • 2 2 个回答
  • 135 Views

2 个回答

  • Voted
  1. PeterJ
    2019-07-02T04:45:30+08:002019-07-02T04:45:30+08:00

    以下存储过程将有助于识别这些列。它首先创建一个临时表,该表存储每个整数类型可以保存的最小值和最大值,然后运行动态查询以查找定义这些整数类型之一的每个表/列的最小值和最大值。一旦确定了最小/最大值,它就会查找可以保存当前值的最小类型并给出如下结果:

    table_name      column_name         current_type    min_val max_val proposed_type   proposed_min    proposed_max    space_saved
    RideLegVetting  RideNumber          int             1       21      tinyint         0               255             2025654
    RideLegVetting  LegNumber           int             0       99      tinyint         0               255             2025654
    

    对于每一列,它显示表中找到的当前类型和最小/最大值,以及新的建议类型和它可以容纳的最小/最大值。根据基数,它还指示将节省的空间量的估计值。存储过程如下:

    CREATE PROCEDURE OptimizeIntSizes AS
    BEGIN
        SET NOCOUNT ON
        CREATE TABLE #DataTypeRanges
        (
            name nvarchar(128),
            size tinyint,
            low bigint,
            high bigint
        )
        INSERT INTO #DataTypeRanges VALUES (N'tinyint', 1, 0, 255)
        INSERT INTO #DataTypeRanges VALUES (N'smallint', 2, -32768, 32767)
        INSERT INTO #DataTypeRanges VALUES (N'int', 4, -2147483648, 2147483647)
        INSERT INTO #DataTypeRanges VALUES (N'bigint', 8, -9223372036854775808, 9223372036854775807) 
        CREATE TABLE #Results
        (
            table_name nvarchar(128),
            column_name nvarchar(128),
            current_type nvarchar(128),
            min_val bigint,
            max_val bigint,
            proposed_type nvarchar(128),
            proposed_min bigint,
            proposed_max bigint,
            space_saved bigint
        )
        DECLARE @table_name nvarchar(128)
        DECLARE @column_name nvarchar(128)
        DECLARE @current_type nvarchar(128)
        DECLARE @proposed_type nvarchar(128)
        DECLARE @low bigint
        DECLARE @high bigint
        DECLARE @size tinyint
        DECLARE @cardinality bigint
        DECLARE @min_val bigint
        DECLARE @max_val bigint
        DECLARE @proposed_min bigint
        DECLARE @proposed_max bigint
        DECLARE @proposed_size tinyint
        DECLARE @space_saved bigint
        DECLARE @sql nvarchar(max)
        DECLARE @params nvarchar(max)
        SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED
        DECLARE FindCursor CURSOR STATIC FOR
            SELECT tables.name AS table_name, cols.name AS column_name, types.name, dtr.size, dtr.low, dtr.high
            FROM sys.columns cols
                JOIN sys.tables tables ON tables.object_id = cols.object_id
                JOIN sys.types types ON types.system_type_id = cols.system_type_id
                JOIN #DataTypeRanges dtr ON dtr.name COLLATE DATABASE_DEFAULT = types.name COLLATE DATABASE_DEFAULT
        OPEN FindCursor
        FETCH FindCursor INTO @table_name, @column_name, @current_type, @size, @low, @high
        WHILE @@FETCH_STATUS = 0
        BEGIN
            SET @sql = N'SELECT @cardinality_out = COUNT(1), @min_val_out = MIN([' + @column_name + ']), @max_val_out = MAX([' + @column_name + ']) FROM [' + @table_name + ']'
            SET @params = N'@cardinality_out bigint OUTPUT, @min_val_out bigint OUTPUT, @max_val_out bigint OUTPUT'
            EXECUTE sp_executesql @sql, @params, @cardinality_out = @cardinality OUTPUT, @min_val_out = @min_val OUTPUT, @max_val_out = @max_val OUTPUT
            SELECT TOP 1 @proposed_type = name, @proposed_size = size, @proposed_min = low, @proposed_max = high
                FROM #DataTypeRanges
                WHERE @min_val >= low  AND @max_val <= high
                ORDER BY size
            IF @proposed_type <> @current_type AND @max_val IS NOT NULL
            BEGIN
                SET @space_saved = (@size - @proposed_size) * @cardinality
                INSERT INTO #Results VALUES (@table_name, @column_name, @current_type, @min_val, @max_val, @proposed_type, @proposed_min, @proposed_max, @space_saved)
            END
            FETCH FindCursor INTO @table_name, @column_name, @current_type, @size, @low, @high
        END
        CLOSE FindCursor
        DEALLOCATE FindCursor
        SELECT * FROM #Results ORDER BY space_saved DESC
    END
    
    • 5
  2. Best Answer
    Joe Obbish
    2019-07-02T16:15:26+08:002019-07-02T16:15:26+08:00

    如果您可以升级到 SQL Server 2016 SP1 或更高版本,您可能会为自己节省大量工作。即使在从该服务包开始的 Express 版本中也可以使用数据压缩。您可以简单地将行压缩应用于所有表和索引,以节省比通过更改数据类型获得的空间更多的空间。那是因为您提到的数据类型仅使用通过行压缩来拟合实际值所需的字节。文档截图:

    在此处输入图像描述

    • 3

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve