AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77590446
Accepted
mr.T
mr.T
Asked: 2023-12-02 21:02:27 +0800 CST2023-12-02 21:02:27 +0800 CST 2023-12-02 21:02:27 +0800 CST

calcular uma sequência de expressões de forma eficiente

  • 772

Eu tenho alguns dados

set.seed(1)
n <- 100
df <- data.frame(
  x = sample(1:30, n, replace = T),
  y = sample(1:30, n, replace = T),
  z = sample(1:30, n, replace = T)
)

e vetor com expressões, elas podem ser diferentes.

rules <- c("df$x[i] < df$y[i-2] - df$x[i]", 
           "df$y[i] >= mean(df$x)",
           "df$y[i] == 20",
           "df$z[i-30] >= df$x[5]",
           "df$y[i-5] == 16",
           "df$x[10] > sd(as.matrix(df[(i-5):i,]))")

A seguir, tenho uma função que busca sequencialmente o acionamento da primeira expressão, depois da segunda e assim por diante

seq_rules <- function(df, rules, show=T){
  
ln <- length(rules)
res <- matrix(0,nrow = ln, ncol = 2, dimnames = list(NULL, c("row","res")))
n <- 1

  for(i in 30:nrow(df)){
    if(eval(str2expression(rules[n]))){
      res[n,"row"] <- i
      res[n,"res"] <- 1
      if(show) print( cbind.data.frame(df[i,], rule=rules[n], row=i))
      n <- n+1
    }
    if(n>ln) break
  }
res
}

Eu gostaria de acelerar meu código. Como você escreveria esse código para torná-lo o mais rápido possível? Também gosto que sua solução seja idêntica à minha em diferentesseeds

=======================================

se as regras são representadas como funções já avaliadas

Frules <- lapply(rules,\(x) eval(str2expression(paste("function(i) {", x ,"}"))))

Então posso ganhar um pouco de velocidade devido à ausência eval(str2expression..))no loop

Nova função

Fseq_rules <- function(df, rules){
  ln <- length(rules)
  res <- matrix(0,nrow = ln, ncol = 2, dimnames = list(NULL, c("row","res")))
  n <- 1
for(i in 30:nrow(df)){
    if(rules[[n]](i)){
        res[n,"row"] <- i
        res[n,"res"] <- 1
        n <- n+1
      }
    if(n>ln) break
  }
  res
}

microbenchmark::microbenchmark(Fseq_rules(df, Frules),
                                seq_rules(df, rules,show = F),times = 100)
Unit: milliseconds
                           expr      min       lq     mean   median       uq      max neval
          Fseq_rules(df, Frules) 1.083315 1.118951 1.283135 1.156011 1.247808 5.601309   100
 seq_rules(df, rules, show = F) 2.495045 2.545790 2.779712 2.607938 2.861662 6.243315   100
  • 1 1 respostas
  • 70 Views

1 respostas

  • Voted
  1. Best Answer
    Michael M
    2023-12-02T23:36:47+08:002023-12-02T23:36:47+08:00

    Não muito mais rápido que o original:

    rules2 <- c(
      "x[i] < y[i-2] - x[i]", 
      "y[i] >= mean(x)",
      "y[i] == 20",
      "z[i-30] >= x[5]",
      "y[i-5] == 16",
      "x[10] > sd(as.matrix(df[(i-5):i,]))"
    )
    
    seq_rules2 <- function(df, rules) {
      rules <- sapply(rules, str2expression)
      M <- length(rules)
      res <- matrix(0L, nrow = M, ncol = 2L, dimnames = list(NULL, c("row", "res")))
      j <- 1L
      
      for (i in 30:nrow(df)) {
        if (eval(rules[[j]], envir = df)) {
          res[j, ] <- c(i, 1L)
          j <- j + 1L
        }
        if(j > M) break
      }
      res
    }
    
    bench::mark(seq_rules(df, rules), seq_rules2(df, rules2))
    
    

    insira a descrição da imagem aqui

    Você ganhará muita velocidade se substituir dfpor uma matriz. E altere as regras de acordo:

    M <- as.matrix(df)
    
    rules_matrix <- c(
      "df[i, 'x'] < y[i-2] - x[i]", 
      "df[i, 'y'] >= mean(df[, 'x'])",
      "df[i, 'y'] == 20",
      "df[i-30, 'z'] >= df[5, 'x']",
      "df[i-5, 'y'] == 16",
      "df[10, 'x'] > sd(df[(i-5):i, ])"
    )
    
    seq_rules_matrix <- function(df, rules) {
      rules <- sapply(rules, str2expression)
      M <- length(rules)
      res <- matrix(0L, nrow = M, ncol = 2L, dimnames = list(NULL, c("row", "res")))
      j <- 1L
      
      for (i in 30:nrow(df)) {
        if (eval(rules[[j]])) {
          res[j, ] <- c(i, 1L)
          j <- j + 1L
        }
        if(j > M) break
      }
      res
    }
    
    bench::mark(
      mat = seq_rules_matrix(M, rules_matrix),
      df = seq_rules2(df, rules2)
    )
    
    

    insira a descrição da imagem aqui

    • 2

relate perguntas

  • Adicionar número de série para atividade de cópia ao blob

  • A fonte dinâmica do empacotador duplica artefatos

  • Selecione linhas por grupo com 1s consecutivos

  • Lista de chamada de API de gráfico subscritoSkus estados Privilégios insuficientes enquanto os privilégios são concedidos

  • Função para criar DFs separados com base no valor da coluna

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve