AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / coding / 问题 / 79597056
Accepted
Johnny Bones
Johnny Bones
Asked: 2025-04-29 02:03:03 +0800 CST2025-04-29 02:03:03 +0800 CST 2025-04-29 02:03:03 +0800 CST

在 SQL 查询中高效比较 DATE 和 DATETIME 列

  • 772

我有包含数百万(可能数十亿)行的表,所以我确实需要高效地进行查询。

在这个查询中,我连接了多个表。所涉及的段是:

LEFT JOIN 
    dbo.GCSOCTPS dbo_GCSOCTPS ON (GC_TBMED.MED_CLASS_NUM = dbo_GCSOCTPS.CLASS_NUM) 
                              AND (GC_TBMED.MED_SOC_NUM = dbo_GCSOCTPS.SOC_NUM)
                              AND (GC_TBMED.MED_EFF_DATE = dbo_GCSOCTPS.EFF_DATE)
                              AND (GC_TBMED.MED_CANC_DATE = dbo_GCSOCTPS.CANC_DATE)) 

GC_TBMED格式为日期DATE,格式dbo_GCSOCTPS为日期DATETIME。遗憾的是,由于我们公司使用数据的方式,我无法更改这一点。

比较这些列最有效的方法是什么???CAST我 CONVERT见过有人转换成文本格式再比较。我希望有人能根据他们处理海量数据集的经验来指导我。

如果我运行此代码块,我会得到 HDHPQ 的值:

SELECT TOP 200 
    HDHPQ,
    SOC_NUM, 
    EFF_DATE,
    CLASS_NUM,
    CANC_DATE
FROM
    dbo.GCSOCTPS
WHERE
    SOC_NUM = '25521'
    AND CLASS_NUM = '37'
    AND CANC_DATE IS NULL;

返回结果如下:

HDHPQ    SOC_NUM    EFF_DATE                  CLASS_NUM    CANC_DATE 
N         25521    2025-01-01 00:00:00.000      37         NULL

如果我运行此代码块,我也会得到返回的数据:

SELECT TOP 200 
    MED_SOC_NUM,
    MED_EFF_DATE,
    MED_CLASS_NUM,
    MED_CANC_DATE
FROM
    [dbo].[AS_tblTBMED] GC_TBMED
WHERE 
    GC_TBMED.MED_SOC_NUM = '25521'
    AND GC_TBMED.MED_CLASS_NUM = '37'
    AND GC_TBMED.MED_CANC_DATE IS NULL;

返回结果如下:

MED_SOC_NUM    MED_EFF_DATE    MED_CLASS_NUM    MED_CANC_DATE
25521        2025-01-01        37                NULL

每个查询都返回一行。我需要将它们连接起来,以便获取第二个查询中的所有数据以及第一个查询中的 HDHPQ 值。

所以我运行这个查询:

SELECT DISTINCT TOP 200 
    dbo_GCSOCTPS.HDHPQ,
    dbo_GCSOCTPS.SOC_NUM, 
    dbo_GCSOCTPS.EFF_DATE,
    dbo_GCSOCTPS.CLASS_NUM,
    dbo_GCSOCTPS.CANC_DATE,
    GC_TBMED.MED_SOC_NUM,
    GC_TBMED.MED_EFF_DATE,
    GC_TBMED.MED_CLASS_NUM,
    GC_TBMED.MED_CANC_DATE
FROM
    [dbo].[AS_tblTBMED] GC_TBMED
LEFT JOIN 
    dbo.GCSOCTPS dbo_GCSOCTPS ON (GC_TBMED.MED_CLASS_NUM = dbo_GCSOCTPS.CLASS_NUM) 
                              AND (GC_TBMED.MED_SOC_NUM = dbo_GCSOCTPS.SOC_NUM)
                              AND (GC_TBMED.MED_EFF_DATE = CAST(dbo_GCSOCTPS.EFF_DATE as DATE))
                              AND (GC_TBMED.MED_CANC_DATE = CAST(dbo_GCSOCTPS.CANC_DATE as DATE)) 
WHERE
    GC_TBMED.MED_SOC_NUM = '25521'
    AND GC_TBMED.MED_CLASS_NUM = '37'
    AND GC_TBMED.MED_CANC_DATE IS NULL
    AND dbo_GCSOCTPS.EFF_DATE >= '2025-01-01';

返回的是一个空的记录集。如果我注释掉连接语句中的两个日期,就能得到数据。所以,我的假设是日期字段没有完全相等,因为它们是相等的,所以如果查询中包含它们,我应该能得到数据。

sql
  • 4 4 个回答
  • 178 Views

4 个回答

  • Voted
  1. Best Answer
    siggemannen
    2025-04-29T03:33:07+08:002025-04-29T03:33:07+08:00

    这里至少有两个问题:

    1. LEFT JOIN 和 dbo_GCSOCTPS 上的 WHERE 使事物变成 INNER JOIN
    2. 您正在加入 NULL 字段,但<anything> = NULL永远不会成立,因此加入将失败。

    您可能需要类似以下内容的内容:

    select DISTINCT top 200 
    gcs.HDHPQ,
    gcs.SOC_NUM, 
    gcs.EFF_DATE,
    gcs.CLASS_NUM,
    gcs.CANC_DATE,
    tbm.MED_SOC_NUM,
    tbm.MED_EFF_DATE,
    tbm.MED_CLASS_NUM,
    tbm.MED_CANC_DATE
    from [dbo].[AS_tblTBMED] tbm
    LEFT JOIN dbo.GCSOCTPS gcs 
        ON tbm.MED_CLASS_NUM = gcs.CLASS_NUM
        AND tbm.MED_SOC_NUM = gcs.SOC_NUM
        AND tbm.MED_EFF_DATE = CAST(gcs.EFF_DATE as DATE)
        AND gcs.CANC_DATE IS NULL
    where tbm.MED_SOC_NUM = '25521'
    and tbm.MED_CLASS_NUM = '37'
    and tbm.MED_CANC_DATE is NULL
    and tbm.MED_EFF_DATE >= '20250101';
    

    不过,还有几行比较可疑:

    1. CAST(gcs.EFF_DATE as DATE)如果 EFF_DATE 不包含小时等,你可以跳过转换
    2. tbm.MED_CLASS_NUM = '37'为什么使用'37'而不只是37用于看起来像数字的列?
    3. DISTINCT 和 TOP 很少是正确的组合,如果有重复,你可能需要重新考虑你的查询
    • 4
  2. Thomas Koelle
    2025-04-29T18:05:14+08:002025-04-29T18:05:14+08:00

    对于这些旧的数据类型,我会选择cast

    print cast(cast ('24 dec 2024 12:00' as datetime) as date)
    

    我不明白为什么这会增加任何开销。

    • 0
  3. Serkan Ekşioğlu
    2025-04-29T21:34:03+08:002025-04-29T21:34:03+08:00

    什么让它变得高效?索引

    所以您需要做的就是让它们可索引。

    这意味着您不能在日期和日期时间字段周围使用任何包装函数(例如将它们转换为字符串或整数)

    有一些无害的异常,例如 DateAdd()。在寻找范围时它仍然是范围。

    所以使用

    DateTime >= Date AND DateTime < DATEADD(DAY, 1, Date)

    很好..

    并且我永远不会使用类似的东西;

    WHERE CAST(DateTimeColumn AS DATE) = DateColumn

    • 0
  4. mezzanayne
    2025-04-29T09:56:44+08:002025-04-29T09:56:44+08:00

    正如其他人提到的,数据中 CANC_DATE 的 NULL 值阻止了您的返回。尝试将 NULL 转换为实际日期值:

    SELECT DISTINCT TOP 200 
        dbo_GCSOCTPS.HDHPQ,
        dbo_GCSOCTPS.SOC_NUM, 
        dbo_GCSOCTPS.EFF_DATE,
        dbo_GCSOCTPS.CLASS_NUM,
        dbo_GCSOCTPS.CANC_DATE,
        GC_TBMED.MED_SOC_NUM,
        GC_TBMED.MED_EFF_DATE,
        GC_TBMED.MED_CLASS_NUM,
        GC_TBMED.MED_CANC_DATE
    FROM
        [dbo].[AS_tblTBMED] GC_TBMED
    LEFT JOIN 
        dbo.GCSOCTPS dbo_GCSOCTPS ON (GC_TBMED.MED_CLASS_NUM = dbo_GCSOCTPS.CLASS_NUM) 
                                  AND (GC_TBMED.MED_SOC_NUM = dbo_GCSOCTPS.SOC_NUM)
                                  AND (IsNull(GC_TBMED.MED_EFF_DATE, '1900-01-01') = CAST(IsNull(dbo_GCSOCTPS.EFF_DATE, '1900-01-01') as DATE))
                                  AND (IsNull(GC_TBMED.MED_CANC_DATE, '1900-01-01') = CAST(IsNull(dbo_GCSOCTPS.CANC_DATE, '1900-01-01') as DATE)) 
    WHERE
        GC_TBMED.MED_SOC_NUM = '25521'
        AND GC_TBMED.MED_CLASS_NUM = '37'
        AND GC_TBMED.MED_CANC_DATE IS NULL
        AND dbo_GCSOCTPS.EFF_DATE >= '2025-01-01';
    
    • -1

相关问题

  • 更新除某些列上具有相同值的行之外的所有行

  • 当我返回 sql 列时,有没有办法只反转数字?(希伯来语)

  • 布尔值之间的 SQL less/greater 比较会产生意外结果

  • 如何根据数组中的匹配更新 Postgres 表中的值

  • 如何在sql server中对列求和

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    重新格式化数字,在固定位置插入分隔符

    • 6 个回答
  • Marko Smith

    为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会?

    • 2 个回答
  • Marko Smith

    VScode 自动卸载扩展的问题(Material 主题)

    • 2 个回答
  • Marko Smith

    Vue 3:创建时出错“预期标识符但发现‘导入’”[重复]

    • 1 个回答
  • Marko Smith

    具有指定基础类型但没有枚举器的“枚举类”的用途是什么?

    • 1 个回答
  • Marko Smith

    如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误?

    • 6 个回答
  • Marko Smith

    `(表达式,左值) = 右值` 在 C 或 C++ 中是有效的赋值吗?为什么有些编译器会接受/拒绝它?

    • 3 个回答
  • Marko Smith

    在 C++ 中,一个不执行任何操作的空程序需要 204KB 的堆,但在 C 中则不需要

    • 1 个回答
  • Marko Smith

    PowerBI 目前与 BigQuery 不兼容:Simba 驱动程序与 Windows 更新有关

    • 2 个回答
  • Marko Smith

    AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String”

    • 1 个回答
  • Martin Hope
    Fantastic Mr Fox msvc std::vector 实现中仅不接受可复制类型 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant 使用 chrono 查找下一个工作日 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor 构造函数的成员初始化程序可以包含另一个成员的初始化吗? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský 为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul C++20 是否进行了更改,允许从已知绑定数组“type(&)[N]”转换为未知绑定数组“type(&)[]”? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann 为什么 {2,3,10} 和 {x,3,10} (x=2) 的顺序不同? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller 在 5.2 版中,bash 条件语句中的 [[ .. ]] 中的分号现在是可选的吗? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench 为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng 为什么 `dict(id=1, **{'id': 2})` 有时会引发 `KeyError: 'id'` 而不是 TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String” 2024-03-20 03:12:31 +0800 CST

热门标签

python javascript c++ c# java typescript sql reactjs html

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve