AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 78752268
Accepted
Sergio
Sergio
Asked: 2024-07-16 07:55:52 +0800 CST2024-07-16 07:55:52 +0800 CST 2024-07-16 07:55:52 +0800 CST

Multiplicação de números enormes em python

  • 772

Estou trabalhando em um pequeno programa python para mim e preciso de um algoritmo para multiplicação rápida de uma enorme matriz com números (mais de 660.000 números, cada um com 9 dígitos). O número do resultado tem mais de 4 milhões de dígitos. Atualmente estou usando math.prod, que calcula em aproximadamente 10 minutos, mas é muito lento, especialmente se eu quiser aumentar a quantidade de números.

Verifiquei alguns algoritmos para multiplicações mais rápidas, por exemplo o algoritmo de Schönhage-Strassen e a multiplicação de Toom-Cook, mas não entendi como eles funcionam ou como fazê-los. Tentei algumas versões que encontrei na internet, mas não funcionam muito bem e são ainda mais lentas. Gostaria de saber se alguém sabe como multiplicar essas quantidades de números mais rapidamente ou poderia explicar como usar um pouco de matemática para fazer isso?

python
  • 3 3 respostas
  • 88 Views

3 respostas

  • Voted
  1. Best Answer
    Ry-
    2024-07-16T08:03:35+08:002024-07-16T08:03:35+08:00

    math.prodacumulará um produto, um número de cada vez. Você pode fazer melhor dividindo recursivamente a lista, pegando o produto de cada metade, por exemplo, o que reduz o tamanho dos produtos intermediários.

    Isso é executado em alguns segundos para mim:

    import math
    
    
    def recursive_prod(ns, r):
        if len(r) <= 10:  # arbitrary small base case
            return math.prod(ns[i] for i in r)
    
        split_at = len(r) // 2
        return recursive_prod(ns, r[:split_at]) * recursive_prod(ns, r[split_at:])
    
    
    import random
    ns = [random.randrange(1_000_000_000) for _ in range(660_000)]
    p = recursive_prod(ns, range(len(ns)))
    
    • 5
  2. no comment
    2024-07-16T09:16:50+08:002024-07-16T09:16:50+08:00

    Tenho usado um método complicado, sempre multiplicando os dois números mais antigos ainda não multiplicados até que reste apenas um:

    from operator import mul
    
    def prod(ns):
        ns = list(ns)
        it = iter(ns)
        ns += map(mul, it, it)
        return ns[-1]
    

    Quase tão rápido quanto o de @Ry-. A velocidade vem de Karatsuba entrando em ação ao multiplicar dois números grandes em vez de um grande e um minúsculo.

    E usar decimalparece cerca de cinco vezes mais rápido devido aos algoritmos de multiplicação ainda mais rápidos (e tem a vantagem de ser muito mais rápido para imprimir em decimal, se você quiser):

    from operator import mul
    from decimal import *
    
    setcontext(Context(prec=MAX_PREC, Emax=MAX_EMAX))
    
    def prod(ns):
        ns = list(map(Decimal, ns))
        it = iter(ns)
        ns += map(mul, it, it)
        return ns[-1]
    
    • 3
  3. Tim Peters
    2024-07-16T10:52:36+08:002024-07-16T10:52:36+08:00

    Existem duas chaves para tornar isso rápido. Primeiro, usando a implementação múltipla mais rápida que você pode obter. Para multiplicandos "suficientemente grandes", o Karatsuba mult do Python é O(n^1.585). O decimalmult NTT muito mais sofisticado do módulo é mais parecido com O(n log n). Mas o mais rápido de tudo é instalar o gmpy2pacote de extensão, que envolve a biblioteca GMP do GNU, cujo objetivo principal é a velocidade máxima. Isso tem essencialmente a mesma assintótica que decimalmult, mas com um fator constante menor.

    Em segundo lugar, os algoritmos múltiplos avançados funcionam melhor ao multiplicar dois inteiros grandes com aproximadamente o mesmo tamanho (número de bits). Você pode deixar isso para a sorte ou, como abaixo, pode forçá-lo usando uma fila de prioridade e, a cada passo, multiplicando os “dois menores” produtos parciais restantes.

    from gmpy2 import mpz
    from heapq import heapreplace, heappop, heapify
    
    # Assuming your input ints are in `xs`.
    mpzs = list(map(mpz, xs))
    heapify(mpzs)
    for _ in range(len(mpzs) - 1):
        heapreplace(mpzs, heappop(mpzs) * mpzs[0])
    assert len(mpzs) == 1
    # the result is mpzs[0]
    

    Esse é o código que eu usaria. Observe que o custo da recursão (que não é usado) é trivial comparado ao custo da aritmética enorme. As operações de heap são mais caras que a recursão, mas ainda relativamente baratas, e podem muito mais do que reembolsar seu custo se a entrada estiver em uma ordem tal que os métodos "por sorte" não tenham sorte o suficiente.

    • 3

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Quando devo usar um std::inplace_vector em vez de um std::vector?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Martin Hope
    Aleksandr Dubinsky Por que a correspondência de padrões com o switch no InetAddress falha com 'não cobre todos os valores de entrada possíveis'? 2024-12-23 06:56:21 +0800 CST
  • Martin Hope
    Phillip Borge Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle? 2024-12-12 20:46:46 +0800 CST
  • Martin Hope
    Oodini Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores? 2024-12-12 06:27:11 +0800 CST
  • Martin Hope
    sleeptightAnsiC `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso? 2024-11-09 07:18:53 +0800 CST
  • Martin Hope
    The Mad Gamer Quando devo usar um std::inplace_vector em vez de um std::vector? 2024-10-29 23:01:00 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST
  • Martin Hope
    MarkB Por que o GCC gera código que executa condicionalmente uma implementação SIMD? 2024-02-17 06:17:14 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve