AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77246833
Accepted
mclayton
mclayton
Asked: 2023-10-07 03:04:16 +0800 CST2023-10-07 03:04:16 +0800 CST 2023-10-07 03:04:16 +0800 CST

Listar arquivos no histórico do git que foram excluídos, mas *não* adicionados novamente

  • 772

Estou tentando listar os nomes de todos os arquivos que existiram em qualquer ponto do histórico de uma ramificação, mas que foram excluídos posteriormente e não existem no commit mais recente dessa ramificação.

As respostas em outras perguntas semelhantes (mas não idênticas) sugerem o seguinte:

git log --all --pretty=format: --name-only --diff-filter=D

mas isso lista todas as operações individuais de exclusão de arquivos de todos os commits no histórico da ramificação, sem considerar se os arquivos foram adicionados novamente.

Eu uso o git regularmente o suficiente para ser perigoso e minha terminologia pode estar um pouco errada, então aqui está um exemplo concreto do que estou tentando fazer:

git init

:: add three files
echo aaa > aaa.txt
echo bbb > bbb.txt
echo ccc > ccc.txt
git add --all
git commit -m "initial commit"

:: delete aaa.txt, bbb.txt
del aaa.txt
del bbb.txt
git add --all
git commit -m "delete aaa.txt, bbb.txt"

:: re-add aaa.txt
echo zzz > aaa.txt
git add --all
git commit -m "re-add aaa.txt"

Estou tentando descobrir qual comando preciso listar bbb.txt- não me importo que aaa.txttenha sido excluído em algum momento porque foi adicionado novamente posteriormente, portanto, atualmente existe na ponta do galho.

Também não estou preocupado com o conteúdo dos arquivos, apenas identificando os nomes/caminhos dos arquivos "ausentes".

Especificamente, gostaria que a saída deste comando hipotético fosse:

bbb.txt

Se a saída também puder listar o commit mais recente do qual os arquivos "ausentes" foram excluídos, isso será um bônus, mas não essencial.

git
  • 3 3 respostas
  • 82 Views

3 respostas

  • Voted
  1. Best Answer
    Brian61354270
    2023-10-07T03:40:23+08:002023-10-07T03:40:23+08:00

    Assumindo um ambiente shell Unix, você pode usar commfrom coreutilspara comparar a lista de arquivos excluídos com uma lista de arquivos na revisão atual:

    $ comm -23  \
        <(git log --all --pretty=format: --name-only --diff-filter=D | sort | uniq | grep -v '^$') \
        <(git ls-files | sort)
    
    bbb.txt
    

    Dividindo isso:

    • O commcomando compara dois arquivos classificados linha por linha. Passar -23faz com que ele imprima apenas as linhas contidas no primeiro arquivo, mas não no segundo.

    • Os dois "arquivos" para os quais são passados comm​​são substituições de processos ( <(...)).

      • A primeira substituição de processo é uma versão modificada do comando de arquivo excluído da pergunta. A saída é transmitida sort | uniqpara obter uma lista classificada de caminhos de arquivos exclusivos. A saída também é passada grep -v '^$'para remover uma incômoda linha em branco.

      • A segunda substituição de processo usa git ls-filespara buscar os nomes de todos os arquivos na revisão atual. Eles são classificados usando sortpara mantê-los commfelizes.

    • O resultado é uma lista de todos os arquivos que foram excluídos em algum momento do histórico e que também não estão contidos na revisão atual.


    Bônus: obter o commit mais recente que excluiu cada arquivo excluído

    Depois de ter os caminhos para os arquivos excluídos, você pode determinar em qual commit eles foram excluídos usando

    $ git rev-list -n 1 HEAD -- <file>
    

    Então, para obter todos os arquivos excluídos e os commits em que foram excluídos, você poderia usar algo como

    $ comm -23  \
        <(git log --all --pretty=format: --name-only --diff-filter=D | sort | uniq | grep -v '^$') \ 
        <(git ls-files | sort) \ 
        | while IFS= read -r deleted; do                            
            echo "$deleted" $(git rev-list -n 1 HEAD -- "$deleted");
         done
    bbb.txt 67e026eb45545f9d095ade3ad8f7fe9d5ad3590e
    

    Se você estiver na infeliz situação em que precisa lidar com novas linhas em nomes de arquivos, verifiquei que essa abordagem ainda funciona se você usar linhas delimitadas por NUL em todos os lugares, passando -zpara comm, git log, sort, uniqe grep.

    • 5
  2. mclayton
    2023-10-07T05:08:11+08:002023-10-07T05:08:11+08:00

    Eu não queria vincular outras respostas a uma linguagem/plataforma específica, mas estou usando especificamente o PowerShell (Core) 7.3 (para ser executado no Windows e Linux) - adaptei a resposta de @ Brian61354270 e apenas postei aqui para devolva algo...

    $PSNativeCommandArgumentPassing = "Standard";
    
    $deleted_files = (
        git log -z --all --pretty=format: --name-only --diff-filter=D
    ).Split(0, [StringSplitOptions]::RemoveEmptyValues) | select-object -unique;
    
    $current_files = (
        git ls-files -z
    ).Split(0, [StringSplitOptions]::RemoveEmptyValues)
    
    $missing_files = Compare-Object -ReferenceObject $deleted_files -DifferenceObject $current_files `
        | where-object { $_.SideIndicator -eq "<=" } `
        | select-object -ExpandProperty "InputObject";
    
    $results = $missing_files | foreach-object {
        [pscustomobject] @{
            "File"   = $_
            "Commit" = (git rev-list -z -n 1 HEAD -- $_)
        }
    }
    
    $results | format-table
    
    File    Commit
    ----    ------
    bbb.txt 01f2686a4a287c11544afaa34a04ef69db35bae1
    
    • 1
  3. jthill
    2023-10-07T05:57:57+08:002023-10-07T05:57:57+08:00
    git log --pretty=format:%h --name-status \
    | awk 'NF==1 { commit=$1 } NF>1 && !seen[$2]++ && $1=="D" && $1=commit' FS=$'\t'
    

    "Na git logsaída de status de nome com um cabeçalho apenas de hash, se houver apenas um campo, é o ID do commit, então lembre-se disso, caso contrário, se não vimos o nome do arquivo antes, esta é a última coisa feita para isso, se for uma exclusão, queremos esta linha, sabemos que são todas exclusões, então apenas substitua pelo DID do commit."

    • 1

relate perguntas

  • Acidentalmente, cliquei em um botão que excluiu todos os commits feitos para um site, mas tenho um backup no meu computador - como restaurar? [fechado]

  • Modificando autores e utilizando Git Rebase em fluxos de trabalho colaborativos

  • Como imprimir facilmente as informações padrão do autor do Git?

  • Qual é a maneira certa de extrair minhas alterações do gitlab para o servidor remoto?

  • Posso rebasear e mesclar uma solicitação pull para uma ramificação que bloqueia push e commits não assinados?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve