AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77588080
Accepted
mr.T
mr.T
Asked: 2023-12-02 05:08:18 +0800 CST2023-12-02 05:08:18 +0800 CST 2023-12-02 05:08:18 +0800 CST

como iterar rapidamente funções uma por uma

  • 772

eu tenho alguns dados

set.seed(1)
n <- 100
df <- data.frame(
  x = sample(1:30, n, replace = T),
  y = sample(1:30, n, replace = T),
  z = sample(1:30, n, replace = T)
)

E também tenho uma lista de funções, o número de funções pode ser qualquer, a complexidade das funções também (eu as simplifiquei intencionalmente para este exemplo)

rules <- list(function(i) df$x[i]==26,
              function(i) df$y[i]==17,
              function(i) df$z[i]==14)

A seguir, tenho uma função que busca sequencialmente o acionamento da primeira função, depois da segunda e assim por diante

# search sequence
# first x[i]==26 then y[i]==17 then z[i]==14
find_rules <- function(df, rules){
ln <- length(rules)
n <- 1
res <- matrix(0,nrow = ln, ncol = 2, dimnames = list(NULL, c("row","res")))
for(i in 1:nrow(df)){
  if(rules[[n]](i)){
    res[n,"row"] <- i
    res[n,"res"] <- 1
    n <- n+1
  }
  if(n==ln+1) break
}
return(res)
}

Gostaria de acelerar find_rulesa função tanto quanto possível sem alterar nada no código apresentado acima. Gostaria também de identidade completa nos cálculos da sua solução e find_rulesnos diferentesseeds()

  • 1 1 respostas
  • 53 Views

1 respostas

  • Voted
  1. Best Answer
    ThomasIsCoding
    2023-12-02T05:37:33+08:002023-12-02T05:37:33+08:00

    Tentei manter o seu código o máximo possível mas podemos mudar a forma de iterar, ou seja, porrules

    find_rules_TIC <- function(df, rules) {
        res <- matrix(0, nrow = length(rules), ncol = 2, dimnames = list(NULL, c("row", "res")))
        rid <- seq_len(nrow(df))
        for (i in seq_along(rules)) {
            k <- which(rules[[i]](rid))
            res[i, "row"] <- k[k >= res[ifelse(i == 1, 1, i - 1), "row"]][1]
            res[i, "res"] <- 1
        }
        res
    }
    

    que deve ser mais rápido que sua solução original se o número de regras for menor que o número de dflinhas .

    referência

    find_rules_mrT <- function(df, rules) {
        ln <- length(rules)
        n <- 1
        res <- matrix(0, nrow = ln, ncol = 2, dimnames = list(NULL, c("row", "res")))
        for (i in 1:nrow(df)) {
            if (rules[[n]](i)) {
                res[n, "row"] <- i
                res[n, "res"] <- 1
                n <- n + 1
            }
            if (n == ln + 1) break
        }
        return(res)
    }
    
    find_rules_TIC <- function(df, rules) {
        res <- matrix(0, nrow = length(rules), ncol = 2, dimnames = list(NULL, c("row", "res")))
        rid <- seq_len(nrow(df))
        for (i in seq_along(rules)) {
            k <- which(rules[[i]](rid))
            res[i, "row"] <- k[k >= res[ifelse(i == 1, 1, i - 1), "row"]][1]
            res[i, "res"] <- 1
        }
        res
    }
    
    find_rules_TIC2 <- function(df, rules) {
        rid <- seq_len(nrow(df))
        cbind(
            row = Reduce(\(a, b) b[b >= a][1],
                lapply(rules, \(f) which(f(rid))),
                init = -Inf,
                accumulate = TRUE
            )[-1],
            res = 1
        )
    }
    
    microbenchmark(
        find_rules_mrT(df, rules),
        find_rules_TIC(df, rules),
        find_rules_TIC2(df, rules),
        check = "equal",
        unit = "relative"
    )
    
    

    e vemos isso

    Unit: relative
                           expr      min       lq     mean   median       uq
      find_rules_mrT(df, rules) 3.825137 3.710938 3.420265 3.628788 3.462264
      find_rules_TIC(df, rules) 1.000000 1.000000 1.000000 1.000000 1.000000
     find_rules_TIC2(df, rules) 1.098361 1.093750 3.288799 1.093434 1.127358
          max neval
      2.89117   100
      1.00000   100
     99.19507   100
    
    • 1

relate perguntas

  • Adicionar número de série para atividade de cópia ao blob

  • A fonte dinâmica do empacotador duplica artefatos

  • Selecione linhas por grupo com 1s consecutivos

  • Lista de chamada de API de gráfico subscritoSkus estados Privilégios insuficientes enquanto os privilégios são concedidos

  • Função para criar DFs separados com base no valor da coluna

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve