Adicionar número de série para atividade de cópia ao blob

Question

xiaodai

Asked: 2024-09-05 21:06:25 +0800 CST2024-09-05 21:06:25 +0800 CST 2024-09-05 21:06:25 +0800 CST

Existe uma versão de entrada de múltiplas colunas do `across` do dplyr?

772

Hoje tive que fazer uma função assim

data1 %>%
  summarise(
   ab1 = fn(a1, b1),
   ab2 = fn(a2, b2), 
   ab3 = fn(a3, b3) 
  )
# imagine if there are 100 of them

Se fnfosse uma função de argumento único eu poderia ter feito

data1 %>%
  summarise(across(starts_with("a", fn)))

Mas infelizmente, minha função precisa de duas colunas como entradas. Existe uma maneira de fazer isso de forma mais elegante?

3 respostas

Voted

ThomasIsCoding · Answer 1 · 2024-09-05T21:38:09+08:00

ThomasIsCoding

2024-09-05T21:38:09+08:002024-09-05T21:38:09+08:00

Provavelmente você pode tentar split.defaultdividir as colunas em grupos por seus nomes, por exemplo,

data1 %>%
  split.default(sub("\\D+", "ab", names(.))) %>%
  map_dfr(\(...) do.call(fn, unname(...)))

o que dá

# A tibble: 3 × 3
    ab1   ab2   ab3
  <dbl> <dbl> <dbl>
1     4    70   208
2    10    88   238
3    18   108   270

exemplo de dados

data1 <- data.frame(
  a1 = c(1, 2, 3),
  b1 = c(4, 5, 6),
  a2 = c(7, 8, 9),
  b2 = c(10, 11, 12),
  a3 = c(13, 14, 15),
  b3 = c(16, 17, 18)
)

fn <- function(a, b) {
  a * b
}

3

Ronak Shah · Answer 2 · 2024-09-05T23:17:56+08:00

Best Answer

Ronak Shah

2024-09-05T23:17:56+08:002024-09-05T23:17:56+08:00

Você pode usar map2*funções para passar dois conjuntos de colunas.

library(dplyr)
library(purrr)

data1 %>%
  summarise(map2_df(pick(starts_with("a")), pick(starts_with("b")), fn))

#  a1 a2 a3
#1 21 57 93

Usar dados de @ThomasIsCoding, mas uma função diferente da que seu código utiliza summarise, significa que haverá uma única linha no final.

fn <- function(a, b) {
  sum(a, b)
}

3

score 3 · Answer 3 · 2024-09-06T01:43:15+08:00

Outra abordagem usando dados remodelados. Se você conseguir superar o obstáculo de remodelar para frente e para trás a partir de uma forma mais longa, o cálculo seria trivial.

Um benefício dessa abordagem é que ela é robusta à ordem das colunas, e você não precisa especificar os prefixos das colunas antecipadamente, desde que haja algum padrão regular que você possa especificar com regex.

library(tidyverse)
data1 |>

  # reshape long, in this case assuming the columns are all (letters)(numbers).
  mutate(row = row_number()) |>
  pivot_longer(cols = -row,
               names_to = c(".value", "Pair"), 
               names_pattern = "(\\D+)(\\d+)") |>

  # do the calculation with the two or more involved columns
  mutate(ab = a*b, .by = c(row, Pair)) |>

  # reshape wider again
  pivot_wider(names_from = Pair, names_glue = "{.value}{Pair}", names_vary = "slowest",
              values_from = a:ab)

Saída usando dados de @ThomasIsCoding:

    row    a1    b1   ab1    a2    b2   ab2    a3    b3   ab3
  <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1     1     1     4     4     7    10    70    13    16   208
2     2     2     5    10     8    11    88    14    17   238
3     3     3     6    18     9    12   108    15    18   270

Existe uma versão de entrada de múltiplas colunas do `across` do dplyr?

exemplo de dados

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Existe uma versão de entrada de múltiplas colunas do `across` do dplyr?

3 respostas

exemplo de dados

relate perguntas