Bugsy提出的问题 -coding

Bugsy

Asked: 2025-04-15 22:04:23 +0800 CST

Ocorrências de contagem de R dplyr que estão em múltiplas condições

Sou novo no dplyr e gostaria de saber uma maneira rápida de obter esses dados:

EU IA	Idade	AnoMorreu
100	2	2005
102	4	N / D
103	1	N / D
106	5	2002
108	1	N / D
109	1	N / D
110	4	N / D
112	3	N / D

Para esses dados (contando cada sobrevivente por idade, ou seja, se um ID tem 5 anos, ele passou das idades 1, 2, 3, 4, 5, enquanto um ID de 2 passa apenas de 2 idades (1, 2) (isso faz sentido?):

Idade	Número do Sobrevivente
1	8
2	5
3	4
4	3
5	1

Também é possível combinar o resultado anterior com estes (número de IDs na categoria)?:

Idade	Número atual de IDs
1	3
2	1
3	1
4	2
5	1

Este foi meu código inicial para o último caso:

groupedDf <- inputDf %>%
               count(Age)  %>%
               group_by(Age = case_when(Age == 1 ~ '1',
                                          TRUE ~ as.character(Age))) %>%
               group_by(Age = case_when(Age == 2 ~ '2',
                                          TRUE ~ as.character(Age))) %>%
               group_by(Age = case_when(Age == 3 ~ '3',
                                          TRUE ~ as.character(Age))) %>%
               group_by(Age = case_when(Age == 4 ~ '4',
                                          TRUE ~ as.character(Age))) %>%
               group_by(Age = case_when(Age == 5 ~ '5',
                                          TRUE ~ as.character(Age))) %>%
               summarise(n = sum(n))  %>%
               arrange(nchar(Age), Age)

Bugsy

Asked: 2024-10-29 13:46:07 +0800 CST

usando aplicar e filtrar para R dataframe

Sou novo em R e queria saber como usar uma maneira inteligente de primeiro aplicar uma função em duas colunas de um dataframe e depois filtrar por determinados critérios.

Então a lista inicial fica assim:

Amostra1	Amostra2	Irmãs	Valor
100_99	200_98	Sim	20
101_99	200_98	Sim	20
102_99	200_98	Sim	20
103_99	201_98	Sim	20
104_99	201_98	Sim	20
200_99	100_98	Sim	20
100_99	100_98	Sim	20

e eu quero que fique assim:

Amostra1	Amostra2	Irmãs	Valor
100_99	200_98	Sim	20
200_99	100_98	Sim	20
100_99	100_98	Sim	20

Eu também tenho uma matriz:

paraVerificar <- [100, 200]

O que eu quero fazer:

1º) Basta pegar o primeiro número da string (até o _) de ambas as strings nas colunas "Sample1" e "Sample2"

2º) Verifique se os números estão no array "toCheck"

3º) Mantenha todas as linhas que tenham um número em cada uma dessas colunas

Tentei muitas coisas e não sei se o piping é a opção correta: (Escrevi uma função que apenas pega o primeiro número da string)

qq <-  df %>% 
  df $Sample1 <-lapply(df $Sample1, functionToJustTakeTheFirstNumber)
  df $Sample2 <-lapply(df $Sample2, functionToJustTakeTheFirstNumber)
  filter(Sample1 %in% toCheck && Sample2 %in% toCheck )

Eu sempre recebo mensagens de erro engraçadas como

Erro em match.fun(FUN) :

'df$Sample2' não é uma função, caractere ou símbolo

Ocorrências de contagem de R dplyr que estão em múltiplas condições

usando aplicar e filtrar para R dataframe

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Bugsy's questions