Atualizando todas as linhas, exceto uma que tenha os mesmos valores em determinadas colunas

Question

Arsinq

Asked: 2025-02-05 20:37:19 +0800 CST2025-02-05 20:37:19 +0800 CST 2025-02-05 20:37:19 +0800 CST

Como obtenho pares de resultados correspondentes (1 homem e 1 mulher) com a mesma idade aleatoriamente?

772

Tenho um banco de dados/tabela com esta estrutura:

Ano	Idade	Gênero	ID do pedido
2012	18	M	4268
2021	75	M	7569
2015	56	F	5381
2018	29	M	2876
2014	33	F	3749

O que estou tentando conseguir é que eu quero 400 registros/linhas de tabela puxadas aleatoriamente para formar uma amostra menor, mas preciso de 200 registros masculinos e 200 femininos. Além disso, preciso que cada registro masculino forneça um registro feminino com o mesmo valor de Idade, então eu essencialmente termino com 200 pares de resultados - cada par tendo um masculino e uma feminina da mesma Idade.

Já produzi e testei o seguinte código:

DROP TABLE IF EXISTS #SampleTableM
DROP TABLE IF EXISTS #SampleTableF

SELECT TOP (200) [Year],[Age],[Gender],[OrderID]
INTO #SampleTableM
  FROM [database.name]
  WHERE Age <=90 AND Sex = 'M'
  ORDER BY NEWID()

SELECT TOP (200) [Year],[Age],[Gender],[OrderID]
INTO #SampleTableF
  FROM [database.name]
  WHERE Age <=90 AND Sex = 'F'
  ORDER BY NEWID()

SELECT * FROM #SampleTableM
UNION
SELECT * FROM #SampleTableF;

No entanto, isso só me dá 200 resultados aleatórios de homens e 200 resultados aleatórios de mulheres, sem que cada resultado seja correspondido a alguém do gênero oposto com a mesma idade.

1 respostas

Voted

samhita · Answer 1 · 2025-02-05T21:56:55+08:00

Com base nos comentários, primeiro selecionei uma amostra aleatória de 200 homens e depois comparei a idade com o gênero feminino correspondente às 200 amostras masculinas coletadas. Não tem certeza de como sua saída deve ficar, já que você não compartilhou a saída esperada. Você pode ajustar as colunas na saída conforme necessário.

Aqui está um exemplo

    WITH male_sample AS (
    SELECT TOP (200) [Year], [Age], [Gender], [OrderID]
    FROM test
    WHERE Age <= 90 AND Gender = 'M'
    ),
female_sample AS (
    SELECT TOP (200) m.[Year] AS male_year, m.[Age] AS age, m.[Gender] AS male_gender, m.[OrderID] AS male_OrderID,
           f.[Year] AS female_year, f.[Gender] AS female_gender, f.[OrderID] AS female_OrderID
    FROM male_sample m
    INNER JOIN test f ON m.Age = f.Age
    WHERE f.Gender = 'F'
)

SELECT *
FROM female_sample;

Violino

Masculino_Ano	Idade	Sexo_masculino	Masculino_OrderID	Feminino_Ano	Feminino_Gênero	Feminino_OrderID
2012	18	M	4268	2013	F	4269
2021	75	M	4269	2020	F	4270
2018	29	M	4271	2019	F	4272
2016	56	M	4273	2015	F	4270
2014	33	M	4274	2014	F	4272
2022	40	M	4001	2017	F	4002
2023	50	M	5001	2011	F	5002
2024	60	M	6001	2010	F	6002

EDIT : Conforme o comentário, podemos obter os pares correspondentes em linhas subsequentes usando UNION ALL e, em seguida, ordenar por idade e gênero. Pode haver ou não distribuição igual de idade para cada gênero, mas pelo menos idades semelhantes aparecerão juntas.

Observação : visualmente, isso ainda pode parecer irregular quando o número de homens e mulheres for maior que 2 para uma idade.

WITH male_sample AS (
    SELECT TOP (200) [Year], [Age], [Gender], [OrderID]
    FROM test
    WHERE Age <= 90 AND Gender = 'M'
    ),
female_sample AS (
    SELECT TOP (200) m.[Year] AS male_year, m.[Age] AS age, m.[Gender] AS male_gender, m.[OrderID] AS male_OrderID,
           f.[Year] AS female_year, f.[Gender] AS female_gender, f.[OrderID] AS female_OrderID
    FROM male_sample m
    INNER JOIN test f ON m.Age = f.Age
    WHERE f.Gender = 'F'
),
combined_sample AS (
    SELECT [male_year] AS [Year], [Age], [male_gender] AS [Gender], [male_OrderID] AS [OrderID]
    FROM female_sample
    UNION ALL
    SELECT [female_year] AS [Year], [Age], [female_gender] AS [Gender], [female_OrderID] AS [OrderID]
    FROM female_sample
)
SELECT [Year], [Age], [Gender], [OrderID]
FROM combined_sample
ORDER BY age, Gender  ;

Violino

Saída

Ano	Idade	Gênero	ID do pedido
2013	18	F	4269
2012	18	M	4268
2019	29	F	4272
2018	29	M	4271
2014	33	F	4272
2014	33	M	4274
2017	40	F	4002
2022	40	M	4001
2011	50	F	5002
2023	50	M	5001
2015	56	F	4270
2016	56	M	4273
2010	60	F	6002
2024	60	M	6001
2020	75	F	4270
2021	75	M	4269

Como obtenho pares de resultados correspondentes (1 homem e 1 mulher) com a mesma idade aleatoriamente?

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como obtenho pares de resultados correspondentes (1 homem e 1 mulher) com a mesma idade aleatoriamente?

1 respostas

relate perguntas