Adicionar número de série para atividade de cópia ao blob

Question

RoXTar

Asked: 2025-04-02 17:51:24 +0800 CST2025-04-02 17:51:24 +0800 CST 2025-04-02 17:51:24 +0800 CST

Possível vazamento de memória no meu Blob Service / Blazor Server .NET

772

Adicionei um novo recurso a um dos meus aplicativos Blazor. Isso permite o upload de arquivos para o armazenamento de blobs em blocos. Isso funciona muito bem. Dei uma olhada para processar memória no Visual Studio. Onde meu aplicativo tinha o tempo todo 80 MB, com todas as suas coisas. Mas quando inicio um upload, vejo que o consumo de memória aumenta em 10-20 MB e não volta. Também aumenta a cada upload de um arquivo. Observe que eu carrego arquivos em blocos de 10 MB, antes eu tinha 100 MB e aumentou 100-200 MB. Então agora não tenho certeza se é vazamento de memória (acho que é) ou se o gc demora muito.

aqui minha função de dentro do serviço para referência

public async Task UploadFileToBlobStorage(Stream stream, string fileName, string containerName,string contentType,IProgress<long> progress,CancellationToken cancellationToken)
{
    _logger.LogInformation($"Uploading file {fileName} to container {containerName}");
    var blobServiceClient = new BlobServiceClient(new Uri($"https://{accountName}.blob.core.windows.net"), new DefaultAzureCredential());
    var containerClient = blobServiceClient.GetBlobContainerClient(containerName);
    await containerClient.CreateIfNotExistsAsync(cancellationToken:cancellationToken);
    var blockblobClient = containerClient.GetBlockBlobClient(fileName);

    var blockIds = new List<string>();
    var buffer = new byte[10 * 1024 * 1024]; // 10 MB
    int bytesRead;
    int blockNumber = 0;
    long totalBytesRead = 0;
               

    var blobHttpHeader = new BlobHttpHeaders
    {
        ContentType = contentType,
        ContentDisposition = $"attachment; filename={fileName}",              

    };

    while ((bytesRead = await stream.ReadAsync(buffer.AsMemory( 0, buffer.Length), cancellationToken)) > 0)            
    {
        var blockId = Convert.ToBase64String(Encoding.UTF8.GetBytes(blockNumber.ToString("d6")));
        blockIds.Add(blockId);

        using (var blockStream = new MemoryStream(buffer, 0, bytesRead))
        {
            await blockblobClient.StageBlockAsync(blockId, blockStream,cancellationToken: cancellationToken);
        }
        totalBytesRead += bytesRead;
        progress?.Report(totalBytesRead);
        blockNumber++;
    }

    await blockblobClient.CommitBlockListAsync(blockIds,httpHeaders:blobHttpHeader,cancellationToken:cancellationToken);            
    _logger.LogInformation($"File {fileName} uploaded to container {containerName} successfull");
}

O fluxo variável que é passado para a função é um ibrowserfile que foi criado usando

using var stream = _selectedFile.OpenReadStream(maxAllowedSize: long.MaxValue);

Ficarei feliz em receber dicas.

Alguém vê algum erro grave?
Talvez não haja engano e minha interpretação esteja errada?

Muito obrigado

2 respostas

Voted

Guru Stron · Answer 1 · 2025-04-02T19:33:34+08:00

À primeira vista, não encontrei um vazamento claro, mas há uma coisa que você precisa considerar: você está criando um buffer de 10 MB ( var buffer = new byte[10 * 1024 * 1024]; // 10 MB) para cada upload, o que é maior que o tamanho padrão do Large Object Heap (LOH) :

Se um objeto for maior ou igual a 85.000 bytes em tamanho, ele é considerado um objeto grande. Esse número foi determinado pelo ajuste de desempenho. Quando uma solicitação de alocação de objeto é de 85.000 bytes ou mais, o tempo de execução o aloca no heap de objeto grande.

Portanto, cada matriz irá diretamente para o LOH, que é coletado apenas com a 2ª geração e não é compactado por padrão:

Como o LOH é coletado apenas durante os GCs da geração 2, o segmento LOH só pode ser liberado durante esse GC

e

Mas como a compactação é cara, o GC varre o LOH; ele faz uma lista livre de objetos mortos que podem ser reutilizados mais tarde para satisfazer grandes solicitações de alocação de objetos. Objetos mortos adjacentes são transformados em um objeto livre. ... Como o LOH não é compactado, às vezes o LOH é considerado a fonte de fragmentação

Então, mesmo que a memória não seja realmente necessária (ou seja, nenhuma referência é mantida a ela), ela potencialmente ainda não será coletada/liberada por um bom tempo. É bem provável que seu aplicativo esteja sendo executado no modo GC do servidor, que pode ser bem ganancioso/"preguiçoso" e, em alguns casos, raramente pode executar a coleta de 2ª geração.

Você pode tentar acionar manualmente a coleta e a compactação:

GCSettings.LargeObjectHeapCompactionMode = GCLargeObjectHeapCompactionMode.CompactOnce;
GC.Collect(GC.MaxGeneration, GCCollectionMode.Forced, blocking: true, compacting: true);

Mas essa não é a abordagem recomendada em casos gerais (embora você possa usá-la se souber o que está fazendo ou para testar vazamento de memória - para ver se a memória é realmente reivindicada pelo GC).

A primeira pergunta que você deve fazer é se esse buffer grande é realmente necessário e tente usar um buffer que se ajuste ao Small Object Heap (SOH), ou seja, menos de 85.000 bytes (eu sugeriria muito menos). Se por algum motivo essa não for uma abordagem que você possa usar - você pode considerar usar a abordagem de pooling (ou seja, ArrayPool<T>), mas ela ainda pode alocar dependendo do número de uploads simultâneos. Finalmente, você pode brincar com as configurações de GC, especialmente o Large object heap threshold , mas eu sugeriria ir com a primeira opção ainda (ou seja, usar um buffer menor).

Passando dos comentários:

Adicionei a writeable: falsebandeira. Essa é a chave, é ótima para servir a memória.

RoXTar · Answer 2 · 2025-04-03T21:52:24+08:00

para leitores de acompanhamento. Acabamos com o código funcional acima, mas com uma melhoria. O código funciona como um encanto para muitos usuários que carregam bigfiles.

public async ValueTask UploadFileToBlobStorage(Stream stream, string fileName, string containerName,string contentType,IProgress<long> progress,CancellationToken cancellationToken)
{
    _logger.LogInformation($"Uploading file {fileName} to container {containerName}");
    var blobServiceClient = new BlobServiceClient(new Uri($"https://{accountName}.blob.core.windows.net"), new DefaultAzureCredential());
    var containerClient = blobServiceClient.GetBlobContainerClient(containerName);
    await containerClient.CreateIfNotExistsAsync(cancellationToken:cancellationToken);
    var blockblobClient = containerClient.GetBlockBlobClient(fileName);

    var blockIds = new List<string>();
    var buffer = new byte[10 * 1024 * 1024]; // 10 MB
    
    int bytesRead;
    int blockNumber = 0;
    long totalBytesRead = 0;
               

    var blobHttpHeader = new BlobHttpHeaders
    {
        ContentType = contentType,
        ContentDisposition = $"attachment; filename={fileName}",              

    };

    while ((bytesRead = await stream.ReadAsync(buffer.AsMemory( 0, buffer.Length), cancellationToken)) > 0)            
    {
        var blockId = Convert.ToBase64String(Encoding.UTF8.GetBytes(blockNumber.ToString("d6")));
        blockIds.Add(blockId);

        using (var blockStream = new MemoryStream(buffer, 0, bytesRead,writable:false))
        {
            await blockblobClient.StageBlockAsync(blockId, blockStream,cancellationToken: cancellationToken);
        }
        totalBytesRead += bytesRead;
        progress?.Report(totalBytesRead);
        blockNumber++;
    }

    await blockblobClient.CommitBlockListAsync(blockIds,httpHeaders:blobHttpHeader,cancellationToken:cancellationToken);
    _logger.LogInformation($"File {fileName} uploaded to container {containerName} successfull");
}

Observe "writable:false" no fluxo de memória.

Divirta-se muito

Possível vazamento de memória no meu Blob Service / Blazor Server .NET

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Possível vazamento de memória no meu Blob Service / Blazor Server .NET

2 respostas

relate perguntas