Ei, eu tenho um DataFrame que consiste em 44 colunas. a primeira coluna é um nome e todas as outras colunas são variáveis que podem ser sim/VERDADEIRO ou não/FALSO. Cada nome pode ter várias linhas e quero combinar todas as entradas para um nome e uma variável no campo como no exemplo resumido abaixo. Porém, para 43 colunas não quero fazer isso manualmente, pois sou preguiçoso e é mais sujeito a erros. Alguma idéia de como fazer isso? Também tenho uma lista com todos os nomes das colunas que quero combinar:
library(tidyverse)
df <- tibble(name = c("A", "A", "A", "B", "C", "C"),
variable_one = c(TRUE, FALSE, TRUE, FALSE, FALSE, FALSE),
variable_two = c(FALSE, FALSE, FALSE, TRUE, FALSE, TRUE),
variable_three = c(FALSE, TRUE, TRUE, FALSE, FALSE, TRUE)) |>
group_by(name) |>
summarise(
variable_one = paste(variable_one, collapse = ","),
variable_two = paste(variable_two, collapse = ","),
variable_three = paste(variable_three, collapse = ","),
)
Você pode tentar
across
+starts_with
como abaixoque dá
Uma versão mais curta por base R está usando
aggregate
Alternativamente, você poderia usar seu código existente para obter os resultados esperados
Criado em 10/11/2023 com reprex v2.0.2