Usando uma macro para comprimento de string no especificador de formato scanf () em C

Question

4DescarTes

Asked: 2023-08-18 19:50:54 +0800 CST2023-08-18 19:50:54 +0800 CST 2023-08-18 19:50:54 +0800 CST

Multiplicação mais rápida que *

772

Estou tentando encontrar uma maneira mais rápida do que a multiplicação regular. Eu executo o código no vscode e, pelo que posso ver, não tenho nenhuma otimização habilitada. Eu também tentei gcc -O0 _.c -o _ mas ainda obtive o mesmo resultado. Eu também escrevo o mesmo código em M0 Assembly, mas a multiplicação regular foi novamente a mais rápida. Há algo que estou perdendo, talvez com cálculos de tempo, ou a multiplicação regular é realmente o caminho mais rápido?

#include <stdio.h>
#include <time.h>
#include <stdint.h>
#include <string.h>
#include <stdlib.h>
#include <math.h>

int max(int a, int b) {
    return (a > b) ? a : b;
}

uint64_t karatsuba(uint64_t x, uint64_t y) {
    if (x < 10 || y < 10) {
        return x * y;
    }

    int n = max(log10(x) + 1, log10(y) + 1) / 2;

    uint64_t a = x / (uint64_t)pow(10, n);
    uint64_t b = x % (uint64_t)pow(10, n);
    uint64_t c = y / (uint64_t)pow(10, n);
    uint64_t d = y % (uint64_t)pow(10, n);

    uint64_t ac = karatsuba(a, c);
    uint64_t bd = karatsuba(b, d);
    uint64_t ad_bc = karatsuba(a + b, c + d) - ac - bd;

    return ac * (uint64_t)pow(10, 2 * n) + ad_bc * (uint64_t)pow(10, n) + bd;
}

uint64_t multiply(uint64_t x, uint64_t y) {
    uint64_t result = 0;

    while (x > 0) {
        if (x & 1) {
            result += y;
        }
        x >>= 1;
        y <<= 1;
    }

    return result;
}

int main() {
    uint64_t i = UINT64_MAX;
    uint64_t j = 10;

    clock_t t;
    clock_t m;
    clock_t l;
    int n = 9999999;

    t = clock();
    for (int k = 0; k < n; k++) {
        multiply(i, j);
    }
    t = clock() - t;
    double time_taken = ((double)t) / CLOCKS_PER_SEC;
    printf("Bit Manipulation Multiplication took %.15f seconds to execute in average\n", time_taken / n);

    m = clock();
    for (int k = 0; k < n; k++) {
        uint64_t k_result = i * j;
    }
    m = clock() - m;
    double time_taken2 = ((double)m) / CLOCKS_PER_SEC;
    printf("Regular Multiplication took %.15f seconds to execute in average\n", time_taken2 / n);

    l = clock();
    for (int k = 0; k < n; k++) {
        karatsuba(i, j);
    }
    l = clock() - l;
    double time_taken3 = ((double)l) / CLOCKS_PER_SEC;
    printf("Karatsuba Multiplication took %.15f seconds to execute in average\n", time_taken3 / n);

    printf("\nResults:\n");
    printf("Bit Manipulation Result: %llu\n", multiply(i, j));
    printf("Regular Multiplication Result: %llu\n", i * j);
    printf("Karatsuba Multiplication Result: %llu\n", karatsuba(i, j));

    return 0;
}

2 respostas

Voted

PMF · Answer 1 · 2023-08-18T20:01:46+08:00

Best Answer

PMF

2023-08-18T20:01:46+08:002023-08-18T20:01:46+08:00

Claramente, seu algoritmo de karatsuba é ruim aqui, porque envolve vários logaritmos de ponto flutuante e funções pow. Cada um deles é, na melhor das hipóteses, tão rápido quanto uma multiplicação inteira, de modo que claramente não é uma melhoria aqui.

A abordagem de deslocamento de bits em sua multiplyfunção costumava ser mais rápida nas primeiras CPUs (como o Intel 8086), em que uma única multiplicação de 16 bits x 16 bits levaria cerca de 150 ciclos de clock. Mas as CPUs modernas foram muito otimizadas, de modo que uma multiplicação usa muito menos ciclos. Os detalhes variam de acordo com o tipo de CPU e as instruções de montagem exatas usadas, mas a abordagem de deslocamento de bits pode eventualmente ser mais rápida para inteiros muito curtos, portanto, 8 ou 16 bits, mas claramente não para 64 bits, onde a sobrecarga do loop apenas adiciona, bem, sobrecarga .

4

Nierusek · Answer 2 · 2023-08-18T20:01:06+08:00

Nierusek

2023-08-18T20:01:06+08:002023-08-18T20:01:06+08:00

Quando você está multiplicando números inteiros de 64 bits, a multiplicação normal é a mais rápida. Se não fosse, não o usaríamos.

Para ser sincero, não entendo por que você está tentando esses métodos estranhos. Sua função multiplyrequer pular e karatsubarequer log10. Ambos são muito mais lentos do que mula operação no processador. Eu recomendo fortemente a leitura e compreensão de como funcionam as aritméticas de montagem e ponto flutuante. Vale muito a pena.

2

Multiplicação mais rápida que *

destaque o código em HTML usando <font color="#xxx">

Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

Por que as compreensões de lista criam uma função internamente?

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

Por que o construtor de uma variável global não é chamado em uma biblioteca?

Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

Somente operações bit a bit para std::byte em C++ 17?

Multiplicação mais rápida que *

2 respostas

relate perguntas