AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 564051
Accepted
jesse_b
jesse_b
Asked: 2020-01-26 07:03:56 +0800 CST2020-01-26 07:03:56 +0800 CST 2020-01-26 07:03:56 +0800 CST

Como otimizar o GNU paralelo para este uso?

  • 772

Eu criei este script por tédio com o único propósito de usar/testar o GNU paralelo, então sei que não é particularmente útil ou otimizado, mas tenho um script que calculará todos os números primos até n:

#!/usr/bin/env bash

isprime () {
    local n=$1
    ((n==1)) && return 1
    for ((i=2;i<n;i++)); do
        if ((n%i==0)); then
            return 1
        fi
    done
    printf '%d\n' "$n"
}

for ((f=1;f<=$1;f++)); do
    isprime "$f"
done

Quando executado com o loop:

$ time ./script.sh 5000 >/dev/null

real    0m28.875s
user    0m38.818s
sys     0m29.628s

Eu esperaria que a substituição do loop for pelo GNU paralelo fizesse com que isso fosse executado significativamente mais rápido, mas essa não foi minha experiência. Em média, é apenas cerca de 1 segundo mais rápido:

#!/usr/bin/env bash

isprime () {
    local n=$1
    ((n==1)) && return 1
    for ((i=2;i<n;i++)); do
        if ((n%i==0)); then
            return 1
        fi
    done
    printf '%d\n' "$n"
}

export -f isprime

seq 1 $1 | parallel -j 20 -N 1 isprime {}

Executar com paralelo:

$ time ./script.sh 5000 >/dev/null

real    0m27.655s
user    0m38.145s
sys     0m28.774s

Eu não estou realmente interessado em otimizar a isprime()função, só estou querendo saber se há algo que eu possa fazer para otimizar o GNU paralelo?

No meu teste, seqna verdade, é mais rápido do que for ((i=1...)), então, não acho que tenha muito a ver com o tempo de execução


Curiosamente, se eu modificar o loop for para:

for ((f=1;f<=$1;f++)); do
    isprime "$f" &
done | sort -n

Ele roda ainda mais rápido:

$ time ./script.sh 5000 >/dev/null

real    0m5.995s
user    0m33.229s
sys     0m6.382s
bash parallelism
  • 3 3 respostas
  • 503 Views

3 respostas

  • Voted
  1. ctrl-alt-delor
    2020-01-26T08:01:29+08:002020-01-26T08:01:29+08:00

    Não vou mencionar otimizar is_primeiterar para squrare_root de (n).

    Desconfio que a versão com paralelo, esteja gastando uma quantidade significativa de tempo iniciando processos. Portanto, divida-o em pedaços maiores. por exemplo, n/Number_of_cpus deve ser o mais rápido (se cada pedaço levar o mesmo tempo). Experimente alguns tamanhos de pedaços, veja o que acontece.

    Você terá que adaptar seu script para diminuir e incrementar.

    por exemplo, organize a execução paralela (se você tiver 5 núcleos).

    ./script    0 1000 &
    ./script 1000 1000 &
    ./script 2000 1000 &
    ./script 3000 1000 &
    ./script 4000 1000 &
    
    • 1
  2. Best Answer
    Ole Tange
    2020-01-30T02:03:34+08:002020-01-30T02:03:34+08:00

    GNU Parallel gasta 2-10 ms de sobrecarga por trabalho. Ele pode ser reduzido um pouco usando -u, mas isso significa que você pode obter saída de diferentes trabalhos misturados.

    O GNU Parallel não é ideal se seus trabalhos estiverem na faixa de ms e o tempo de execução for importante: a sobrecarga geralmente será muito grande.

    Você pode distribuir a sobrecarga para vários núcleos executando vários GNU Parallels:

    seq 5000 | parallel --pipe --round-robin -N100 parallel isprime
    

    Você ainda paga a sobrecarga, mas agora pelo menos tem mais núcleos para pagar.

    Uma maneira melhor seria mudar isprimepara que seja necessário várias entradas e, portanto, demore mais para ser executado:

    isprime() {
      _isprime () {
          local n=$1
          ((n==1)) && return 1
          for ((i=2;i<n;i++)); do
              if ((n%i==0)); then
                  return 1
              fi
          done
          printf '%d\n' "$n"
      }
      for t in "$@"; do
        _isprime $t
      done
    }
    export -f isprime
    
    seq 5000 | parallel -X isprime
    # If you do not care about order, this is faster because higher numbers always take more time
    seq 5000 | parallel --shuf -X isprime
    
    
    • 1
  3. user373503
    2020-01-27T13:14:23+08:002020-01-27T13:14:23+08:00

    Alterando o loop for principal:

    for ((f=1;f<=$1;f+=2)); do
        isprime $f &
        isprime $((f+1))
    done
    

    ele corre um pouco mais rápido

    ]# time ./jj.sh 5000 |wc
        669     669    3148
    
    real    0m2.537s
    user    0m8.109s
    sys     0m1.374s
    

    do que sem &:

    real    0m5.758s
    user    0m5.761s
    sys     0m0.007s
    

    ou apenas com chamadas em segundo plano &:

    real    0m3.298s
    user    0m10.743s
    sys     0m1.869s
    

    Então, enquanto o e comercial levava você de 28s para 5s, eu fui de 5s para 3s.

    Eu também tentei 2 com e comercial e 1 sem, mas isso já está ficando mais lento.


    ]# time ./jj.sh 5000 |wc
    ^C
    
    real    0m17.668s
    user    0m17.576s
    sys     0m1.344s
    

    Desaceleração dramática (veja o ^C) se o e comercial estiver apenas na segunda chamada:

    for ((f=1;f<=$1;f+=2)); do
        isprime $f
        isprime $((f+1)) &
    done
    

    Isso parece um pouco confuso.


    Usando os números primos encontrados apenas como divisores, você pode acelerar pelo fator 20:

    max=5000
    max2=75
    primes=('3')
    echo '2'; echo '3'
    
    for ((n=5; n<max; n+=2))
    do  size=${#primes[@]}
        for ((pi=0; pi<=$size; pi++))
        do  p=${primes[$pi]}
            if (( $n % $p == 0 ))
            then break
            fi
            if (( $p * $p > $n ))
            then echo $n
                 (( $n < $max2 )) && primes+=("$n")
                 break
            fi
        done
    done
    

    Isto dá:

    ]# time . prim.sh |wc
        669     669    3148
    
    real    0m0.126s
    user    0m0.142s
    sys     0m0.001s
    

    E a mesma coisa em perl:

    ]# time perl prim.pl | wc
        668    1336    6486
    
    real    0m0.008s
    user    0m0.009s
    sys     0m0.001s
    

    (a primeira linha se parece com *** 3, então wca saída é normal)

    Mas este algoritmo é mais difícil de paralelizar: isprime()tem que ter acesso à lista (crescente) de números primos (até sqrt).

    Talvez factor(um comando lutando contra a seção 6 :) seria útil como uma unidade funcional padrão. Então você pode alimentá-lo com diferentes "pedaços".

    ]# time seq 2 5000 |factor |sed '/ .* /d' |cut -f1 -d':' |wc 
        669     669    3148
    
    real    0m0.008s
    user    0m0.014s
    sys     0m0.005s
    

    O sedexclui linhas com mais de um espaço (ou seja, mais de um fator).

    Mas, novamente, é muito rápido para ser ajudado:

    ]# time seq 900000000002 900000005000 | factor  |wc
       4999   26848  163457
    
    real    0m0.031s
    user    0m0.035s
    sys     0m0.003s
    
    • 0

relate perguntas

  • exportar variáveis ​​​​env programaticamente, via stdout do comando [duplicado]

  • Problema estranho ao passar variáveis ​​do arquivo de texto

  • Enquanto a linha lê mantendo os espaços de escape?

  • ordem de substituição de processos `te` e `bash`

  • Execute um script muito lento até que seja bem-sucedido

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve