Tenho um problema muito parecido para resolver assim . No entanto, não estou interessado em classificar. Estou interessado em agrupar (palavra errada talvez) os mesmos objetos de string juntos e somar o valor anexado com string. Em segundo lugar, gostaria de remover uma string das linhas. Preparei um quadro de dados de exemplo. Preparei isso o mais próximo possível do post que mencionei anteriormente.
branch <- c("OL", "CA", "PL", "OR", "FL")
perf <- c("Mattheu (12), Jessica (32), Mattheu (22), Tom (10), HQ",
"Tobias (13), Kurt (22), Mathias (44), HQ, Tobias (55)",
"Tom (30), HQ, Giti (88), Patel (54), Tom (12), Tom (10)",
"Harry (1), Potter (32), Harry (2)",
"Timothy (3), HQ, Sara (44), HQ"
)
> performance <- data.frame(branch, perf)
> performance
branch perf
1 OL Mattheu (12), Jessica (32), Mattheu (22), Tom (10), HQ
2 CA Tobias (13), Kurt (22), Mathias (44), HQ, Tobias (55)
3 PL Tom (30), HQ, Giti (88), Patel (54), Tom (12), Tom (10)
4 OR Harry (1), Potter (32), Harry (2)
5 FL Timothy (3), HQ, Sara (44), HQ
Na primeira linha, tenho Mattheu duas vezes. Quero tê-lo uma vez com os números somados. Isso significa que deve ser Mattheu (34). Em segundo lugar, gostaria de remover a string HQ.
Esta é a expectativa de saída da segunda coluna:
[1] "Mattheu (34), Jessica (32), Tom (10)"
[2] "Tobias (68), Kurt (22), Mathias (44)"
[3] "Tom (52), Giti (88), Patel (54)"
[4] "Harry (3), Potter (32)"
[5] "Timothy (3), Sara (44)"
Como obter o resultado esperado?