os braços de correspondência têm tipos incompatíveis esperados ao reutilizar a função dentro da correspondência

Question

ajz34

Asked: 2025-03-06 19:33:51 +0800 CST2025-03-06 19:33:51 +0800 CST 2025-03-06 19:33:51 +0800 CST

Rust Vec não inicializado causa erro de Double Free

772

Este é um problema de comportamento potencialmente indefinido de memória não inicializada em Rust inseguro.

primeiro, alocando o vetor da maneira segura usual (tipo Vec<Vec<usize>>, ou deve ser vetor de algo no heap em vez da pilha ; em outras palavras, Vec<usize>o tipo não entrará em pânico aqui);
segundo, clone o vetor em um novo escopo ;
terceiro, alocar um novo vetor por meio de uma maneira não inicializada e insegura (sem usar MaybeUninit); então ocorre uma liberação dupla.

O código ( playground ) listado da seguinte forma:

#[deny(clippy::uninit_vec)]
unsafe fn uninitialized_vec<T>(size: usize) -> Vec<T> {
    let mut v: Vec<T> = Vec::with_capacity(size);
    unsafe { v.set_len(size) };
    v
}

fn case_1() {
    println!("=== Case 1 ===");
    let vec_a: Vec<Vec<usize>> = vec![vec![0]; 4];
    let _ = vec_a.clone();
    let _: Vec<Vec<usize>> = unsafe { uninitialized_vec(4) };
}

fn case_2() {
    println!("=== Case 2 ===");
    let vec_a: Vec<Vec<usize>> = vec![vec![0]; 4];
    {
        let _ = vec_a.clone();
    }
    let _: Vec<Vec<usize>> = unsafe { uninitialized_vec(4) };
}

fn main() {
    case_1();
    case_2();
}

modo de depuração: sinal 6 (SIGABRT): abortar programa, liberação dupla detectada no tcache 2; case_2ficará preso aqui;
modo de liberação: sinal 4 (SIGILL): instrução ilegal; até mesmo case_1ficará preso aqui.

Pelo meu senso comum, o código em si não pretende liberar nenhuma variável duas vezes. Nós apenas declaramos uma variável não inicializada, mas não usamos essa variável. Se isso não for um bug, a otimização do compilador é provavelmente a única razão que pode explicar esse problema.

O que me deixa curioso é que: se esse código realmente aciona comportamento indefinido em rust inseguro, essa otimização do compilador pode causar problemas de double free ou outros. E

se for realmente um UB, sinto que esse código pode realmente confundir os novatos em Rust (ou seja, eu mesmo).
se não for um UB, é um bug de ferrugem insegura?

Além disso, sabe-se que o uso MaybeUninitcorreto pode evitar erros de tempo de execução double-free como este:

use std::mem::MaybeUninit;

unsafe fn uninitialized_vec<T>(size: usize) -> Vec<MaybeUninit<T>> {
    let mut v: Vec<MaybeUninit<T>> = Vec::with_capacity(size);
    unsafe { v.set_len(size) };
    v
}

fn main() {
    println!("=== This will not cause error ===");
    let vec_a: Vec<Vec<usize>> = vec![vec![0]; 12];
    {
        let _ = vec_a.clone();
    }
    let _: Vec<MaybeUninit<Vec<usize>>> = unsafe { uninitialized_vec(12) };
}

Ainda assim, MaybeUninitpode ser inconveniente em muitas circunstâncias. Subjetivamente, prefiro usar Vec<T>em vez de Vec<MaybeUninit<T>>, especialmente quando posso ter certeza de que os valores desse vetor não inicializado serão preenchidos corretamente mais tarde.

2 respostas

Voted

Cerberus · Answer 1 · 2025-03-06T20:11:54+08:00

Best Answer

Cerberus

2025-03-06T20:11:54+08:002025-03-06T20:11:54+08:00

Acabamos de declarar uma variável não inicializada, mas não estamos usando essa variável

Isso está incorreto. Estamos usando essa variável - ou seja, estamos descartando o Vec, portanto, descartando todos os Vecs nele, e como eles não são inicializados, estamos tentando descartar memória arbitrária.

se esse código realmente aciona comportamento indefinido em ferrugem insegura

Sim, de acordo com a documentação para set_len:

Segurança
<...>
Os elementos em old_len..new_len devem ser inicializados.

Este requisito é explicitamente violado.

comportamento indefinido em ferrugem insegura, que a otimização do compilador pode causar problemas de dupla liberação ou outros

Se você disparar um comportamento indefinido, o processo de compilação pode fazer qualquer coisa com seu programa , por definição. Não é "este código pode estar mal otimizado desta forma" - é "você mentiu para o compilador, todas as apostas estão canceladas".

6

Matthieu M. · Answer 2 · 2025-03-06T20:55:08+08:00

Isenção de responsabilidade: Cerberus respondeu à pergunta principal. Vou me concentrar nas melhores práticas/perguntas implícitas.

Uso correto de`set_len`

Subjetivamente, prefiro usar Vec<T>em vez de Vec<MaybeUninit<T>>, especialmente quando posso ter certeza de que os valores desse vetor não inicializado serão preenchidos corretamente mais tarde .

Conforme mencionado na resposta do @Cerberus, set_lensó deve ser usado depois que os elementos forem inicializados.

Ou seja, a maneira correta de usar set_lené:

fn main() {
    const SIZE: usize = 5;

    let mut vec: Vec<Vec<usize>> = Vec::with_capacity(SIZE);

    {
        let spare = vec.spare_capacity_mut();

        (0..SIZE).for_each(|i| { spare[i].write(Vec::new()); });
    }

    //  Safety:
    //  - All elements in 0..SIZE have been initialized.
    unsafe { vec.set_len(SIZE); }
}

Pré-lavagem de suas calças com Rust

Gankra ¹ , um dos principais designers do Rust inseguro nos primeiros dias, escreveu um artigo chamado Pre-pooping your pants with Rust , que é muito apropriado aqui.

A essência do artigo é que uma das principais dificuldades para escrever um código sólido unsafe é prever todas as maneiras pelas quais algo pode dar errado: qualquer retorno antecipado, qualquer pânico, etc., que podem ocorrer antes de você "cumprir" uma promessa.

Dica: é basicamente impossível, tendo em vista que o código está em constante mudança.

A solução que Grankra propôs é, portanto, "pré-cagar" suas calças. Por exemplo, quando você chama vec.drain(start..end), todos os elementos em start..enddevem ser removidos, e apenas os elementos em 0..starte end..(catenados juntos) permanecem. Mas quem sabe o que pode ocorrer ao fazer tudo isso?

Assim, o código para drenagem irá:

Defina o comprimento de vecpara start. Ele não o deixará no comprimento atual, nem o definirá no comprimento final.
Faça um furo no vec, até que todos os elementos start..endtenham sido retirados.
Mova os elementos para dentro end..( start..preenchendo o buraco, parcialmente).
E SÓ ENTÃO defina o comprimento de vecpara o número final de elementos que realmente restam.

Se por qualquer razão o Drainiterador vazar no meio de tudo isso, deixando um buraco com elementos não inicializados... está tudo certo , porque todos os elementos 0..startestão (ainda) inicializados, e essa é a única promessa que vecestá sendo feita até (4), e em (4) tudo está bem novamente.

Ou, dito de outra forma: você nunca promete que fará algo que não seja seguro; em vez disso, você primeiro faz e depois anuncia que está feito.

¹ Você pode conhecer Gankra de Learn Rust With Entirely Too Many Linked Lists .

Talvez o Uninit seja inconveniente

Sim. Sim, é.

Na verdade, código escrito corretamente unsafe, com todas as // Safetyanotações, é tedioso de escrever. E verboso. É o que é preciso para escrever unsafecódigo verificável e sólido.

Se você não se importa, então não use unsafe!

Gostaria de ressaltar que não há benefício algum em usar unsafenos cenários que você demonstrou aqui:

fn defaulted_vec<T>(size: usize) -> Vec<T>
where
   T: Default,
{
    (0..size).map(T::default).collect()
}

fn case_1() {
    println!("=== Case 1 ===");
    let vec_a: Vec<Vec<usize>> = vec![vec![0]; 4];
    let _ = vec_a.clone();
    let _: Vec<Vec<usize>> = defaulted_vec(4);
}

fn case_2() {
    println!("=== Case 2 ===");
    let vec_a: Vec<Vec<usize>> = vec![vec![0]; 4];
    {
        let _ = vec_a.clone();
    }
    let _: Vec<Vec<usize>> = defaulted_vec(4);
}

fn main() {
    case_1();
    case_2();
}

defaulted_veccriará Vec4 valores padrão, que são baratos — porque Vec::new()não alocam nada — e você poderá usá-los/substituí-los quando quiser.

Rust Vec não inicializado causa erro de Double Free

Uso correto de`set_len`

Pré-lavagem de suas calças com Rust

Talvez o Uninit seja inconveniente

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Rust Vec não inicializado causa erro de Double Free

2 respostas

Uso correto deset_len

Pré-lavagem de suas calças com Rust

Talvez o Uninit seja inconveniente

relate perguntas

Uso correto de`set_len`