Sou novo no dplyr e gostaria de saber uma maneira rápida de obter esses dados:
EU IA | Idade | AnoMorreu |
---|---|---|
100 | 2 | 2005 |
102 | 4 | N / D |
103 | 1 | N / D |
106 | 5 | 2002 |
108 | 1 | N / D |
109 | 1 | N / D |
110 | 4 | N / D |
112 | 3 | N / D |
Para esses dados (contando cada sobrevivente por idade, ou seja, se um ID tem 5 anos, ele passou das idades 1, 2, 3, 4, 5, enquanto um ID de 2 passa apenas de 2 idades (1, 2) (isso faz sentido?):
Idade | Número do Sobrevivente |
---|---|
1 | 8 |
2 | 5 |
3 | 4 |
4 | 3 |
5 | 1 |
Também é possível combinar o resultado anterior com estes (número de IDs na categoria)?:
Idade | Número atual de IDs |
---|---|
1 | 3 |
2 | 1 |
3 | 1 |
4 | 2 |
5 | 1 |
Este foi meu código inicial para o último caso:
groupedDf <- inputDf %>%
count(Age) %>%
group_by(Age = case_when(Age == 1 ~ '1',
TRUE ~ as.character(Age))) %>%
group_by(Age = case_when(Age == 2 ~ '2',
TRUE ~ as.character(Age))) %>%
group_by(Age = case_when(Age == 3 ~ '3',
TRUE ~ as.character(Age))) %>%
group_by(Age = case_when(Age == 4 ~ '4',
TRUE ~ as.character(Age))) %>%
group_by(Age = case_when(Age == 5 ~ '5',
TRUE ~ as.character(Age))) %>%
summarise(n = sum(n)) %>%
arrange(nchar(Age), Age)