AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 290143
Accepted
Mike S
Mike S
Asked: 2021-04-21 10:42:13 +0800 CST2021-04-21 10:42:13 +0800 CST 2021-04-21 10:42:13 +0800 CST

如何使用 SQL Server 中 XML 数据中的序号位置(不是名称)解析列名?

  • 772

我在数据库中有数百个具有相同结构的表:

一些Id、Pos、 不同数量的其他字段

因此,例如,一个表可能如下所示:

PersonId, Pos, Hobby, Degree
12345, 1, Basketball, Bachelor of Science
12345, 2, Baseball, Master of Science
12345, 3, Boxing, NULL
12345, 4, Tennis, NULL
22222, 1, Golf, Bachelor of Science
22222, 2, NULL, Master of Science
22222, 3, NULL, Doctorate

我想汇总每列 3-N 的值。所以这会变成:

12345, "Basketball, Baseball, Boxing, Tennis",  "Bachelor of Science, Master of Science"
22222, "Golf", "Bachelor of Science, Master of Science, Doctorate"

另一个表可能如下所示:

ClientId, Pos, Location, Language, CommunicationType
33333, 1, North Carolina, English, Phone
33333, 2, New York, Spanish, Email
33333, 3, NULL, Portuguese, NULL
44444, 1, California, English, Phone
44444, 2, NULL, NULL, Email

变成这样:

33333, "North Carolina, New York", "English, Spanish, Portugeue", "Phone, Email"
44444, "California", "English", "Phone, Email"

我想做的是创建一个 TVF,我可以在其中指定表名并让函数返回其字段。理想情况下,就像我刚刚在上面演示的那样卷起来。

Solomon Rutzky 提供了一个解决方案(SQL Server:将表名作为参数传递给表值函数),他展示了如何使用 XML 和 CASE 语句在 TVF 中接受表名。

这是一个改编:

DECLARE @TableName sysname = 'objects'
/*
DECLARE @TableName sysname = 'columns'
DECLARE @TableName sysname = 'indexes'
*/
       
SELECT tab.BaseData.value(N'/row[1]/@name', N'VARCHAR(128)') AS [name],
       tab.BaseData.value(N'/row[1]/@object_id', N'BIGINT') AS [object_id],
       *
FROM (
    SELECT CASE @TableName
             WHEN N'objects' THEN (SELECT * FROM master.sys.tables FOR XML RAW, TYPE)
             WHEN N'indexes' THEN (SELECT * FROM master.sys.indexes FOR XML RAW, TYPE)
             WHEN N'columns' THEN (SELECT * FROM master.sys.columns FOR XML RAW, TYPE)
           END AS [BaseData]
     ) tab;

如果我要创建一个怪物 CASE 语句并考虑所有可能的传入表名,有没有办法按序号位置(而不是像我上面那样的名称)引用列?更好的是,也可以汇总并划定它们的值(这是我的最终目标)?

先感谢您!

此外,这里是创建我的两个示例表的 DDL:

CREATE TABLE [dbo].[Person](
[PersonId] [int] NULL,
[Pos] [int] NULL,
[Hobby] [varchar](100) NULL,
[Degree] [varchar](50) NULL
)
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (12345, 1, N'Basketball', N'Bachelor of Science')
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (12345, 2, N'Baseball', N'Master of Science')
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (12345, 3, N'Boxing', NULL)
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (12345, 4, N'Tennis', NULL)
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (22222, 1, N'Golf', N'Bachelor of Science')
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (22222, 2, NULL, N'Master of Science')
GO
INSERT [dbo].[Person] ([PersonId], [Pos], [Hobby], [Degree]) VALUES (22222, 3, NULL, N'Doctorate')
GO

CREATE TABLE [dbo].[Client](
[ClientId] [int] NULL,
[Pos] [int] NULL,
[Location] [varchar](100) NULL,
[Language] [varchar](50) NULL,
[CommunicationType] [varchar](50) NULL
)
GO
INSERT [dbo].[Client] ([ClientId], [Pos], [Location], [Language], [CommunicationType]) VALUES (33333, 1, N'North Carolina', N'English', N'Phone')
GO
INSERT [dbo].[Client] ([ClientId], [Pos], [Location], [Language], [CommunicationType]) VALUES (33333, 2, N'New York', N'Spanish', N'Email')
GO
INSERT [dbo].[Client] ([ClientId], [Pos], [Location], [Language], [CommunicationType]) VALUES (33333, 3, NULL, N'Portuguese', NULL)
GO
INSERT [dbo].[Client] ([ClientId], [Pos], [Location], [Language], [CommunicationType]) VALUES (44444, 1, N'California', N'English', N'Phone')
GO
INSERT [dbo].[Client] ([ClientId], [Pos], [Location], [Language], [CommunicationType]) VALUES (44444, 2, NULL, NULL, N'Email')
GO

SELECT * FROM Person;
SELECT * FROM Client;
sql-server t-sql
  • 3 3 个回答
  • 389 Views

3 个回答

  • Voted
  1. Best Answer
    Mikael Eriksson
    2021-04-21T22:23:54+08:002021-04-21T22:23:54+08:00

    有没有办法按序号位置引用列

    是的,但我不确定这将如何帮助你做你想做的事。您将序数位置放在谓词中,就像您已经为row[1].

    改为'/row[1]/@name'获取第三列将如下所示'/row[1]/@*[3]'。您应该知道空值不会创建任何属性,因此第三个属性中的数据并不总是来自第三列。

    要解决此问题,您可以为列值生成元素而不是属性,并用于XSINIL获取列中空值的空元素,例如:SELECT * FROM master.sys.indexes FOR XML RAW, ELEMENTS XSINIL, TYPE. 然后您需要从 XML 中选择第三个元素而不是第三个属性'/row[1]/*[3]'。

    您已经在“创建一个怪物 CASE 语句并考虑所有可能的传入表名”的路径上,所以为什么不创建一个怪物查询来代替您想要的东西,而不需要 XML 的东西。

    select T.PersonId as Id,
           '"' + string_agg(T.Hobby, ',') within group (order by T.Pos) + '", ' +
           '"' + string_agg(T.Degree, ',') within group (order by T.Pos) + '"' as Value
    from dbo.Person as T
    where @TableName = N'Person'
    group by T.PersonId
    union all
    select T.ClientId,
           '"' + string_agg(T.Location, ',') within group (order by T.Pos) + '", ' +
           '"' + string_agg(T.Language, ',') within group (order by T.Pos) + '", ' +
           '"' + string_agg(T.CommunicationType, ',') within group (order by T.Pos) + '"'
    from dbo.Client as T
    where @TableName = N'Client'
    group by T.ClientId;
    

    如果您需要经常甚至自动更新函数,则可以对元表使用动态 SQL 来生成上述查询。

    由于您使用的是 SQL Server 2016,因此string_agg()您不需要使用它for xml path来进行连接。查询变大了,但原理相同,仍然可以使用动态 SQL 创建。

    select T.PersonId as Id,
           '"' + stuff((
                        select ', '+T2.Hobby 
                        from dbo.Person as T2 
                        where T.PersonId = T2.PersonId 
                        order by T2.Pos 
                        for xml path(''), type).value('text()[1]', 'nvarchar(max)'), 1, 2, '') + '", ' +
           '"' + stuff((
                        select ', '+T2.Degree 
                        from dbo.Person as T2
                        where T.PersonId = T2.PersonId 
                        order by T2.Pos 
                        for xml path(''), type).value('text()[1]', 'nvarchar(max)'), 1, 2, '') + '"' as Value
    from dbo.Person as T
    where @TableName = N'Person'
    group by T.PersonId
    union all
    select T.ClientId,
           '"' + stuff((
                        select ', '+T2.Location 
                        from dbo.Client as T2 
                        where T.ClientId = T2.ClientId 
                        order by T2.Pos 
                        for xml path(''), type).value('text()[1]', 'nvarchar(max)'), 1, 2, '') + '", ' +
           '"' + stuff((
                        select ', '+T2.Language
                        from dbo.Client as T2 
                        where T.ClientId = T2.ClientId
                        order by T2.Pos 
                        for xml path(''), type).value('text()[1]', 'nvarchar(max)'), 1, 2, '') + '", ' +
           '"' + stuff((
                        select ', '+T2.CommunicationType
                        from dbo.Client as T2 
                        where T.ClientId = T2.ClientId
                        order by T2.Pos 
                        for xml path(''), type).value('text()[1]', 'nvarchar(max)'), 1, 2, '') + '"'
    from dbo.Client as T
    where @TableName = N'Client'
    group by T.ClientId;
    
    • 2
  2. Charlieface
    2021-04-22T00:29:28+08:002021-04-22T00:29:28+08:00

    您不能在此处使用动态 SQL,因为这在 TVF 中不起作用。不过,您可以使用动态生成下面的实际代码。

    鉴于您在 SQL Server 2016 上,您没有STRING_AGG可用的,因此您将不得不使用FOR XML/STUFF方法,这对于多列非常复杂。

    不必为每一列再次查询数据,也不必执行,您可以使用APPLY和的组合.value

    CREATE OR ALTER FUNCTION GetTableInfo (@Tablename sysname)
    RETURNS TABLE
    AS RETURN
    (
        SELECT PersonId AS Id,
            '"' + STUFF(v.XmlValues.query('for $c in col1 return concat(",", string($c))').value('text()[1]','nvarchar(max)'),1,1,'') + '" ' +
            '"' + STUFF(v.XmlValues.query('for $c in col2 return concat(",", string($c))').value('text()[1]','nvarchar(max)'),1,1,'') + '" ' +
            '"' + STUFF(v.XmlValues.query('for $c in col3 return concat(",", string($c))').value('text()[1]','nvarchar(max)'),1,1,'') + '" ' AS RollupValues
        FROM (SELECT DISTINCT PersonId FROM Person) t1
        CROSS APPLY (VALUES((
                SELECT col1, col2, col3
                FROM Person t2
                WHERE t2.PersonId = t1.PersonId
                ORDER BY t2.Pos
                FOR XML PATH (''), TYPE
            ))) v(XmlValues)
        WHERE @Tablename = 'Person'
       UNION ALL
        SELECT ClientId,
            '"' + STUFF(v.XmlValues.query('for $c in col1 return concat(",", string($c))').value('text()[1]','nvarchar(max)'),1,1,'') + '" ' +
            '"' + STUFF(v.XmlValues.query('for $c in col2 return concat(",", string($c))').value('text()[1]','nvarchar(max)'),1,1,'') + '" ' +
            '"' + STUFF(v.XmlValues.query('for $c in col3 return concat(",", string($c))').value('text()[1]','nvarchar(max)'),1,1,'') + '" ' AS RollupValues
        FROM (SELECT DISTINCT ClientId FROM Client) t1
        CROSS APPLY (VALUES((
                SELECT col1, col2, col3
                FROM Client t2
                WHERE t2.ClientId = t1.ClientId
                ORDER BY t2.Pos
                FOR XML PATH (''), TYPE
            ))) v(XmlValues)
        WHERE @Tablename = 'Client'
       UNION ALL
    ......
    );
    
    GO
    

    重申一下,您需要替换col1,col2为实际的列名,与表名相同。您不能在函数中使用动态 SQL 来执行此操作。


    为了完整起见,我将展示STRING_AGG更简单的方法:

    CREATE OR ALTER FUNCTION GetTableInfo (@Tablename sysname)
    RETURNS TABLE
    AS RETURN
    (
        SELECT PersonId AS Id,
            '"' + STRING_AGG(CAST(col1 AS nvarchar(max)), ', ') WITHIN GROUP (ORDER BY Pos) + '" ' +
            '"' + STRING_AGG(CAST(col2 AS nvarchar(max)), ', ') WITHIN GROUP (ORDER BY Pos) + '" ' +
            '"' + STRING_AGG(CAST(col3 AS nvarchar(max)), ', ') WITHIN GROUP (ORDER BY Pos) + '" ' AS RollupValues
        FROM Person
        WHERE @Tablename = 'Person'
        GROUP BY PersonId
       UNION ALL
        SELECT ClientId,
            '"' + STRING_AGG(CAST(col1 AS nvarchar(max)), ', ') WITHIN GROUP (ORDER BY Pos) + '" ' +
            '"' + STRING_AGG(CAST(col2 AS nvarchar(max)), ', ') WITHIN GROUP (ORDER BY Pos) + '" ' +
            '"' + STRING_AGG(CAST(col3 AS nvarchar(max)), ', ') WITHIN GROUP (ORDER BY Pos) + '" ' AS RollupValues
        FROM Client
        WHERE @Tablename = 'Client'
        GROUP BY ClientId
       UNION ALL
    ......
    );
    
    GO
    
    • 1
  3. Paul White
    2021-04-26T07:00:07+08:002021-04-26T07:00:07+08:00

    我不相信使用函数可以完全按照您的意愿行事,因为它必须具有固定的输出形状(数字、类型和列名)。

    一种可能的近似方法是返回固定数量的列(具有通用名称),每个列都包含字符串的聚合,对于不适用于列数少于最大值的源表的额外列,返回 null。

    如其他答案中所述,STRING_AGG这是理想的选择,但在 SQL Server 2016 中不可用。如链接的问答中所述,SQL CLR 流式表值函数可以提供有效的替代品。现在,我知道你了'会说无论出于何种原因你都不能使用 SQL CLR,但是为了将来有类似要求的读者的利益,这里是一个示例实现。

    出于技术原因,代码使用环回连接,因此前几个参数指定服务器/实例名称和数据库名称。第三个参数是表格,预计包含一个整数id列,第二个位置是一个整数排序列。其余列均假定为字符串。

    此示例实现仅限于五个这样的列。它对表进行一次有序传递,并通过一次仅将当前组保留在内存中来最小化内存使用量。它应该比解决方案快得多XML PATH。

    示例调用和结果

    SELECT 
        GTD.id,
        GTD.col1, 
        GTD.col2, 
        GTD.col3, 
        GTD.col4, 
        GTD.col5
    FROM dbo.GetTableData
    (
        @@SERVERNAME,
        DB_NAME(),
        N'dbo.Person'
    ) AS GTD;
    
    ID col1 col2 col3 col4 col5
    12345 篮球、棒球、拳击、网球 理学学士、理学硕士 无效的 无效的 无效的
    22222 高尔夫球 理学学士、理学硕士、博士 无效的 无效的 无效的
    SELECT 
        GTD.id,
        GTD.col1, 
        GTD.col2, 
        GTD.col3, 
        GTD.col4, 
        GTD.col5
    FROM dbo.GetTableData
    (
        @@SERVERNAME,
        DB_NAME(),
        N'dbo.Client'
    ) AS GTD;
    
    ID col1 col2 col3 col4 col5
    33333 北卡罗来纳,纽约 英语、西班牙语、葡萄牙语 电话、电子邮件 无效的 无效的
    44444 加利福尼亚 英语 电话、电子邮件 无效的 无效的

    T-SQL

    CREATE ASSEMBLY [DBA] AUTHORIZATION [dbo]
    FROM 
    WITH PERMISSION_SET = EXTERNAL_ACCESS;
    GO
    CREATE OR ALTER FUNCTION dbo.GetTableData
    (
        @ServerInstance [nvarchar](128), 
        @DatabaseName [nvarchar](128), 
        @TableName [nvarchar](257)
    )
    RETURNS TABLE 
    (
        id integer NULL,
        col1 nvarchar(max) NULL,
        col2 nvarchar(max) NULL,
        col3 nvarchar(max) NULL,
        col4 nvarchar(max) NULL,
        col5 nvarchar(max) NULL
    )
    ORDER (id)
    AS EXTERNAL NAME [DBA].[UserDefinedFunctions].[GetTableData];
    

    C# 源代码

    using Microsoft.SqlServer.Server;
    using System;
    using System.Collections;
    using System.Data.SqlClient;
    using System.Data.SqlTypes;
    using System.Text;
    
    public partial class UserDefinedFunctions
    {
        [SqlFunction(
            DataAccess = DataAccessKind.Read,
            SystemDataAccess = SystemDataAccessKind.None,
            FillRowMethodName = "FillRow",
            TableDefinition = @"
                id integer NULL,
                col1 nvarchar(max) NULL,
                col2 nvarchar(max) NULL,
                col3 nvarchar(max) NULL,
                col4 nvarchar(max) NULL,
                col5 nvarchar(max) NULL
        ")]
        public static IEnumerable GetTableData
        (
            [SqlFacet(MaxSize = 128)] string ServerInstance,
            [SqlFacet(MaxSize = 128)] string DatabaseName,
            [SqlFacet(MaxSize = 257)] string TableName
        )
        {
            const string COMMA_SPACE = ", ";
            const int MAX_OUTPUT_COLS = 5;
            const int FIXED_COLS = 2;
    
            // Establish loopback connection
            var csb = new SqlConnectionStringBuilder
            {
                DataSource = ServerInstance,
                InitialCatalog = DatabaseName,
                IntegratedSecurity = true,
                ConnectTimeout = 5,
                Enlist = false
            };
    
            using var loopback = new SqlConnection(csb.ConnectionString);
            try
            {
                loopback.Open();
            }
            catch (Exception e)
            {
                throw new Exception("Loopback connection failed.", e);
            }
    
            // Check supplied table name exists and is accessible
            using var command = new SqlCommand($@"SELECT OBJECT_ID('{TableName}', 'U');", loopback);
    
            object object_id = command.ExecuteScalar();
    
            if (Convert.DBNull.Equals(object_id))
            {
                throw new ArgumentException($@"Table '{TableName}' not found in database {DatabaseName}.");
            }
    
            // Read table in the required order
            command.CommandText = $@"SELECT * FROM {TableName} ORDER BY 1, 2;";
            SqlDataReader reader = command.ExecuteReader();
    
            // Number of columns to process (skipping id and position)
            int columns = reader.FieldCount - FIXED_COLS;
    
            if (columns > MAX_OUTPUT_COLS)
            {
                throw new ArgumentOutOfRangeException(
                    nameof(TableName),
                    $@"Table {TableName} has {columns} additional columns. The maximum is {MAX_OUTPUT_COLS}.");
            }
    
            // Create a string builder and SqlString array element for each output column
            StringBuilder[] sb = new StringBuilder[columns];
            SqlString[] SqlStrings = new SqlString[MAX_OUTPUT_COLS];
    
            for (int i = 0; i < MAX_OUTPUT_COLS; i++)
            {
                SqlStrings[i] = SqlString.Null;
                if (i < columns)
                {
                    sb[i] = new StringBuilder(256);
                }
            }
    
            // Remember the current id value
            SqlInt32 previous_id = SqlInt32.Null;
    
            // Process each row
            while (reader.Read())
            {
                SqlInt32 id = reader.GetSqlInt32(0);
    
                if (!id.IsNull)
                {
                    if (!id.Equals(previous_id))
                    {
                        if (!previous_id.IsNull)
                        {
                            // Completed a group
                            for (int i = 0; i < columns; i++)
                            {
                                SqlStrings[i] = new SqlString(sb[i].ToString());
                                sb[i].Clear();
                            }
    
                            // Output the completed group
                            yield return (previous_id, SqlStrings);
                        }
                        previous_id = new SqlInt32(id.Value);
                    }
    
                    // Add the current row to the string builders
                    for (int i = 0; i < columns; i++)
                    {
                        var s = reader.GetSqlString(i + FIXED_COLS);
                        if (!s.IsNull)
                        {
                            if (sb[i].Length > 1)
                            {
                                sb[i].Append(COMMA_SPACE);
                            }
                            sb[i].Append(s.Value);
                        }
                    }
                }
            }
    
            // Final group
            for (int i = 0; i < columns; i++)
            {
                SqlStrings[i] = new SqlString(sb[i].ToString());
            }
    
            // Output the completed group
            yield return (previous_id, SqlStrings);
        }
    
        // Called by SQL Server to populate each row returned from the TVF
        public static void FillRow
            (
            object row,
            out SqlInt32 id,
            out SqlString col1,
            out SqlString col2,
            out SqlString col3,
            out SqlString col4,
            out SqlString col5
            )
        {
            (SqlInt32 id, SqlString[] cols) v = ((SqlInt32, SqlString[]))row;
            id = v.id;
            col1 = v.cols[0];
            col2 = v.cols[1];
            col3 = v.cols[2];
            col4 = v.cols[3];
            col5 = v.cols[4];
        }
    }
    
    • 1

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve