更新除某些列上具有相同值的行之外的所有行

Question

Arsinq

Asked: 2025-02-05 20:37:19 +0800 CST2025-02-05 20:37:19 +0800 CST 2025-02-05 20:37:19 +0800 CST

如何随机获得年龄相同的匹配结果（1 男 1 女）？

772

我有一个具有以下结构的数据库/表：

年	年龄	性别	订单编号
2012	18	米	4268
2021	75	米	7569
2015	56	F	5381
2018	二十九	米	2876
2014	33	F	3749

我想要实现的是，我希望随机抽取 400 条记录/表行以形成一个较小的样本，但我需要 200 条男性记录和 200 条女性记录。除此之外，我需要每条男性记录都给出一条具有相同年龄值的女性记录，因此我最终得到了 200 对结果 - 每对都有相同年龄的男性和女性。

我已经制作并尝试了以下代码：

DROP TABLE IF EXISTS #SampleTableM
DROP TABLE IF EXISTS #SampleTableF

SELECT TOP (200) [Year],[Age],[Gender],[OrderID]
INTO #SampleTableM
  FROM [database.name]
  WHERE Age <=90 AND Sex = 'M'
  ORDER BY NEWID()

SELECT TOP (200) [Year],[Age],[Gender],[OrderID]
INTO #SampleTableF
  FROM [database.name]
  WHERE Age <=90 AND Sex = 'F'
  ORDER BY NEWID()

SELECT * FROM #SampleTableM
UNION
SELECT * FROM #SampleTableF;

但是，这只会给我提供 200 个随机男性结果和 200 个随机女性结果，并且每个结果都没有与年龄相同的对立性别之一相匹配。

1 个回答

Voted

samhita · Answer 1 · 2025-02-05T21:56:55+08:00

根据评论，我首先随机选择了 200 个男性样本，然后匹配与收集的 200 个男性样本相对应的女性性别的年龄。不确定您的输出应该是什么样子，因为您没有分享预期的输出，您可以根据需要调整输出中的列。

以下是一个例子

    WITH male_sample AS (
    SELECT TOP (200) [Year], [Age], [Gender], [OrderID]
    FROM test
    WHERE Age <= 90 AND Gender = 'M'
    ),
female_sample AS (
    SELECT TOP (200) m.[Year] AS male_year, m.[Age] AS age, m.[Gender] AS male_gender, m.[OrderID] AS male_OrderID,
           f.[Year] AS female_year, f.[Gender] AS female_gender, f.[OrderID] AS female_OrderID
    FROM male_sample m
    INNER JOIN test f ON m.Age = f.Age
    WHERE f.Gender = 'F'
)

SELECT *
FROM female_sample;

小提琴

男_年	年龄	男性	Male_OrderID	女性_年份	女性性别	女性订单ID
2012	18	米	4268	2013	F	4269
2021	75	米	4269	2020	F	4270
2018	二十九	米	4271	2019	F	4272
2016	56	米	4273	2015	F	4270
2014	33	米	4274	2014	F	4272
2022	40	米	4001	2017	F	4002
2023	50	米	5001	2011	F	5002
2024	60	米	6001	2010	F	6002

编辑：根据评论，我们可以使用 UNION ALL 在后续行中获得匹配对，然后按年龄、性别排序。每个性别的年龄分布可能相等，也可能不相等，但至少相似的年龄会出现在一起。

注意：当某个年龄段的男性和女性数量超过 2 时，从视觉上看，这可能仍然看起来不均匀。

WITH male_sample AS (
    SELECT TOP (200) [Year], [Age], [Gender], [OrderID]
    FROM test
    WHERE Age <= 90 AND Gender = 'M'
    ),
female_sample AS (
    SELECT TOP (200) m.[Year] AS male_year, m.[Age] AS age, m.[Gender] AS male_gender, m.[OrderID] AS male_OrderID,
           f.[Year] AS female_year, f.[Gender] AS female_gender, f.[OrderID] AS female_OrderID
    FROM male_sample m
    INNER JOIN test f ON m.Age = f.Age
    WHERE f.Gender = 'F'
),
combined_sample AS (
    SELECT [male_year] AS [Year], [Age], [male_gender] AS [Gender], [male_OrderID] AS [OrderID]
    FROM female_sample
    UNION ALL
    SELECT [female_year] AS [Year], [Age], [female_gender] AS [Gender], [female_OrderID] AS [OrderID]
    FROM female_sample
)
SELECT [Year], [Age], [Gender], [OrderID]
FROM combined_sample
ORDER BY age, Gender  ;

小提琴

输出

年	年龄	性别	订单编号
2013	18	F	4269
2012	18	米	4268
2019	二十九	F	4272
2018	二十九	米	4271
2014	33	F	4272
2014	33	米	4274
2017	40	F	4002
2022	40	米	4001
2011	50	F	5002
2023	50	米	5001
2015	56	F	4270
2016	56	米	4273
2010	60	F	6002
2024	60	米	6001
2020	75	F	4270
2021	75	米	4269

如何随机获得年龄相同的匹配结果（1 男 1 女）？

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

如何随机获得年龄相同的匹配结果（1 男 1 女）？

1 个回答

相关问题