AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77067250
Accepted
Kenneth Hippolite
Kenneth Hippolite
Asked: 2023-09-08 21:18:29 +0800 CST2023-09-08 21:18:29 +0800 CST 2023-09-08 21:18:29 +0800 CST

C++ ReadFile inteiramente, onde tamanho> 2 GB (Win64)

  • 772

Os arquivos aparecem na faixa de 1,1 GB a 3,1 GB. O servidor possui 64 GB de RAM (os servidores menores possuem 24).

Então, acho que vou ler tudo na memória, em vez de usar pedaços. (Pedaços podem cair fora da posição crlf, então eu teria que voltar um pouco. Código muito mais simples para engolir tudo).

ReadFile e ReadFileEx parecem presos em terras de 32 bits, mesmo quando construídos em Win64. Sinto que estou perdendo algo óbvio.

#include <Windows.h>
#include <iostream>
using namespace std;

int main()
{
    cout << "start\r\n";
    HANDLE hInput;
    hInput = CreateFile(L"My-giant-File.txt", GENERIC_READ, 0, NULL, OPEN_EXISTING, 0, 0);

    long long amountOfDataToRead = 4000000000; //Arbitrary 4Gb read buffer
    byte * buffer = reinterpret_cast<byte*>(malloc(amountOfDataToRead));

    DWORD bytesRead = 0;
    ReadFile(hInput, buffer, amountOfDataToRead, &bytesRead, NULL);

    //Perform operation on data

    free(buffer);
    CloseHandle(hInput);

}

Veja acima: bytesRead é um DWord. E aposto que minha contribuição há muito tempo está sendo lida longamente.

windows
  • 2 2 respostas
  • 37 Views

2 respostas

  • Voted
  1. Best Answer
    Remy Lebeau
    2023-09-08T22:33:14+08:002023-09-08T22:33:14+08:00

    ReadFile/Ex()(e apenas E/S em geral) nunca tem garantia de ler exatamente quantos bytes você solicita. Pode ler menos, então você deve estar preparado para lidar com essa possibilidade. É por isso ReadFile/Ex()que informa quantos bytes ele realmente leu. Você precisa levar isso em consideração chamando-o em um loop para ter certeza de ler tudo o que deseja, por exemplo:

    #include <Windows.h>
    #include <iostream>
    using namespace std;
    
    int main()
    {
        cout << "start\r\n";
        HANDLE hInput = CreateFileW(L"My-giant-File.txt", GENERIC_READ, 0, NULL, OPEN_EXISTING, 0, 0);
    
        long long bufferSize = 4000000000LL; //Arbitrary 4Gb read buffer
        byte *buffer = reinterpret_cast<byte*>(malloc(bufferSize));
    
        byte *ptr = buffer;
        long long amountOfDataToRead = bufferSize;
        DWORD bytesRead = 0;
    
        while (amountOfDataToRead > 0) {
            if (!ReadFile(hInput, ptr, amountOfDataToRead, &bytesRead, NULL)) {
                // error handling...
                return -1;
            } 
            if (bytes_read == 0) {
                // unexpected eof...
                return -1;
            }
            ptr += bytesRead;
            amountOfDataToRead -= bytesRead;
        }
    
        //Perform operation on data
    
        free(buffer);
        CloseHandle(hInput);
    
        return 0;
    } 
    
    • 1
  2. Fulgen
    2023-09-08T21:23:19+08:002023-09-08T21:23:19+08:00

    Desafio do quadro: Por que você está lendo arquivos desse tamanho? Considere mapeá-los na memória usando CreateFileMapping/ MapViewOfFile.

    Além disso, você pode chamar ReadFileem um loop - não que seja necessário, pois um arquivo de 3,1 GiB está dentro do intervalo de um número inteiro não assinado de 32 bits.

    • 0

relate perguntas

  • BSOD do Windows Palo Alto Cortex XDR com verificação de bug 0x139

  • Não consigo importar pacotes locais no meu projeto go

  • O KERNEL32.DLL é sempre o terceiro módulo carregado em um processo do Windows?

  • Qual é o problema neste código Rust inseguro para que funcione no Windows, mas não no Ubuntu?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve