AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 303641
Accepted
Zoinky
Zoinky
Asked: 2021-12-08 09:03:35 +0800 CST2021-12-08 09:03:35 +0800 CST 2021-12-08 09:03:35 +0800 CST

比较多个子记录时的查询

  • 772

我似乎无法弄清楚 tsql 应该做什么来执行以下操作。

我想查询具有类别 1 和 2 的所有推文的推文表(可能超过 2 个类别)

所以查询应该为以下插入返回推文 1 和 3

USE tempdb
CREATE TABLE [dbo].[Tweets]([Id] [bigint] NOT NULL)
CREATE TABLE [dbo].[TweetCategories]([TweetId] [bigint] NOT NULL, [CategoryId] [int] NOT NULL)

INSERT INTO Tweets(Id) VALUES(1)
INSERT INTO Tweets(Id) VALUES(2)
INSERT INTO Tweets(Id) VALUES(3)
INSERT INTO Tweets(Id) VALUES(4)

INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(1, 1)
INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(1, 2)

INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(2, 2)
INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(2, 3)

INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(3, 1)
INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(3, 2)
INSERT INTO TweetCategories(TweetId, CategoryId) VALUES(3, 3)


DROP TABLE tweets
DROP TABLE TweetCategories

效率很重要,因为我的推文将有超过 200 万条记录,类别也可能有几百万

sql-server t-sql
  • 2 2 个回答
  • 73 Views

2 个回答

  • Voted
  1. Ronaldo
    2021-12-09T05:22:49+08:002021-12-09T05:22:49+08:00

    由于每次执行的列表大小都不相同,您可以尝试将数组参数传递给存储过程。这是一种方法:

    CREATE TYPE id_list AS TABLE (
        id int NOT NULL PRIMARY KEY
    );
    GO
    
    CREATE PROCEDURE [dbo].[selected_categories] (
        @id_list    id_list READONLY
    )
    AS
    BEGIN
    
        SELECT TC.TweetId
        FROM TweetCategories TC
            INNER JOIN @id_list CL ON TC.CategoryId = CL.id
        GROUP BY TC.TweetId
        HAVING COUNT(1) = (SELECT COUNT(1) FROM @id_list);
    
    END;
    GO
    
    DECLARE @category_list id_list;
        
    INSERT INTO @category_list (id)
    VALUES (1), (2);
    
    EXECUTE [dbo].[selected_categories]
        @id_list = @category_list;
    GO
    
    DROP PROCEDURE selected_categories;
    DROP TYPE id_list;
    GO
    

    为了使这种方法正常工作,我假设 (TweetId, CategoryId) 是一个复合主键,尽管您的示例代码没有显示它。

    • 0
  2. Best Answer
    Thomas Franz
    2021-12-09T06:48:50+08:002021-12-09T06:48:50+08:00

    最简单的方法,如果它总是恰好是两个 ID:

    SELECT *
      FROM dbo.Tweets AS t
     WHERE EXISTS (SELECT * FROM dbo.TweetCategories AS tc WHERE tc.CategoryId = 1 AND tc.TweetId = t.Id)
       AND EXISTS (SELECT * FROM dbo.TweetCategories AS tc WHERE tc.CategoryId = 2 AND tc.TweetId = t.Id)
    
    

    如果要查询的类别是灵活的(数字或 CategoryID),您可能需要以下内容:

    DROP TABLE IF EXISTS #categories_to_query
    CREATE TABLE #categories_to_query (CategoryId INT NOT NULL PRIMARY KEY);
    INSERT INTO #categories_to_query (CategoryId)
    VALUES (1), (2)
    DECLARE @ctq INT = (SELECT COUNT(*) FROM #categories_to_query AS ctq)
    
    SELECT t.*
      FROM dbo.Tweets AS t
     INNER JOIN (SELECT tc.TweetId
                   FROM dbo.TweetCategories AS tc
                  INNER JOIN #categories_to_query AS ctq
                     ON ctq.CategoryId = tc.CategoryId
                  GROUP BY tc.TweetId
                  HAVING COUNT(*) = @ctq
                ) AS cat
       ON cat.TweetId = t.Id
    

    根据要查询的类别“提交”的位置/方式,您可以将其作为表变量传递给您的过程(缺点:您必须为此创建一个类型),将其作为简单的字符串列表传递('1,2'在您的示例中)并在插入 #categories_to_query 之前拆分字符串,或者通过在您的过程中声明例如 10 个参数以允许过滤多达 10 个不同的类别来使其快速而肮脏。

    关于性能:您应该在 dbo.TweetCategories 上有一个 CategoryId、TweetId 的索引(按此顺序!)

    • 0

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve