AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1848192
Accepted
RokeJulianLockhart
RokeJulianLockhart
Asked: 2024-07-06 00:46:25 +0800 CST2024-07-06 00:46:25 +0800 CST 2024-07-06 00:46:25 +0800 CST

Por que os caminhos UTF-8 escapam (de maneira diferente) nas saídas dos principais utilitários CLI?

  • 772

Digamos que sou um psicopata que nomeia meus arquivos como:

  [-]   `{title: "Non-Metadata",    id: "s4a4ji"}`{.JSON5}.dir

Essa é a minha melhor tentativa de criar o nome de arquivo mais horrível e plausível possível - ele usa Pandoc Markdown e JSON5.

POSIX

Se eu inserir isso ls, ele me fornecerá uma versão que pode ser escapada de forma que qualquer shell compatível com POSIX (sh, é claro, mas também bash, no Fedora 40) seja capaz de interpretá-lo sem problemas:

  1. ls "$PWD"
    
  2. '  [-]'$'\t''`{title: "Non-Metadata",'$'\t''id: "s4a4ji"}`{.JSON5}.dir'
    
Octeto

No entanto, treee fileem vez disso, parece substituir caracteres não ASCII por um tipo de representação com escape de octeto, que não parece ser utilizável da maneira descrita acima:

  1. tree "$PWD"
    
  2. .
    └──   [-]\011`{title: "Non-Metadata",\011id: "s4a4ji"}`{.JSON5}.dir
    
    2 directories, 0 files
    
UTF-8

E, claro, o PowerShell Core Get-ChildItemapenas gera a representação UTF-8 completa:

  1. Get-ChildItem -LiteralPath "$PWD" | Select-Object -ExpandProperty 'Name'
    
  2.   [-]   `{title: "Non-Metadata",        id: "s4a4ji"}`{.JSON5}.dir
    

Como é que estes funcionam de forma diferente? Eu esperaria que ls, tree, e filepelo menos operassem de forma idêntica, considerando que - até onde sei - estes são GNU CoreUtils. Além disso, o PowerShell parece demonstrar que nada força fundamentalmente essas ferramentas a escapar de caracteres não-ASCII, então por que estão fazendo isso?

powershell
  • 1 1 respostas
  • 15 Views

1 respostas

  • Voted
  1. Best Answer
    grawity_u1686
    2024-07-06T01:06:33+08:002024-07-06T01:06:33+08:00

    POSIX

    Até onde sei, essa não era a sintaxe POSIX no momento em que sua versão lsfoi lançada; o $'...'único passou a fazer parte do POSIX 2024 na semana passada; até então, era apenas um recurso de sintaxe ksh amplamente adotado.

    No entanto, árvore e arquivo parecem substituir caracteres não-ASCII por uma espécie de representação com escape de octeto

    Esta é uma representação octal , usando uma sintaxe que imita literais de string C. (Que suportam hexadecimal, mas octal é "tradicional" de certa forma.) Acho que esse é o estilo que o libbsd strvis()usa por padrão.

    Além disso, esses não são caracteres "não-ASCII": as guias fazem parte do ASCII, que cobre todos os valores de bytes de 0 a 127. Valores de bytes acima de 127 (0x7F, 0177) seriam não-ASCII.

    Como é que estes funcionam de forma diferente?

    São três programas diferentes, simples assim. Não existe uma função comum para "gerar um nome de arquivo" - cada programa aplica o escape que deseja antes de gravá-lo no stdout. (É aqui também que os estilos GNU e BSD diferem.)

    Eu esperaria que ls, tree e file operassem pelo menos de forma idêntica, considerando que - até onde sei - estes são GNU CoreUtils.

    Não, eles não são. Apenas lso GNU coreutils – os outros dois nem sequer estão sob a égide do GNU.

    Além disso, o PowerShell parece demonstrar que nada força fundamentalmente essas ferramentas a escapar de caracteres não-ASCII, então por que estão fazendo isso?

    Os programas também podem fazer coisas sem serem “fundamentalmente forçados” a fazê-lo. Muitos programas escapam deliberadamente de pelo menos os caracteres de controle ASCII C0 para que não sejam (mal) interpretados pelos terminais, por exemplo.

    Coreutils' lssempre teve uma seleção de --quoting-styles com a intenção de tornar os caracteres 'inválidos' mais fáceis de distinguir e (a partir da versão 9.0, se bem me lembro) deliberadamente usa como padrão aspas no estilo Bash para que tais nomes de arquivos possam ser diretamente copie/cole no shell GNU.

    (Veja também a ferramenta histórica do Unix dswe vários outros truques que as pessoas tiveram que usar para remover um arquivo com um nome de arquivo não digitável.)

    O PowerShell, por outro lado, nem sequer considera a string um nome de arquivo: é apenas uma propriedade com valor de string de algum objeto. Quando o objeto inteiro (o resultado de Get-ChildItem) é formatado como stdout, ele aplica algum escape, mas as propriedades individuais não sabem nada sobre sua localização.

    treeapenas faz um esforço básico para evitar que caracteres de controle ASCII tenham efeitos indesejáveis ​​em seu terminal, mas não visa especificamente a capacidade de cópia.

    • 1

relate perguntas

  • Como colocar string variável em array no powershell?

  • Powershell e regex: lista de arquivos "backup ao salvar" do Notepad ++. Editar nome, classificar por lastwritetime

  • Adicionando cor de primeiro plano ao perfil do Powershell?

  • Não é possível ativar o Microsoft Print to PDF depois de desativado

  • Posso fazer com que este script do PowerShell aceite vírgulas?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como posso reduzir o consumo do processo `vmmem`?

    • 11 respostas
  • Marko Smith

    Baixar vídeo do Microsoft Stream

    • 4 respostas
  • Marko Smith

    O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

    • 6 respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Martin Hope
    Vickel O Firefox não permite mais colar no WhatsApp web? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke Por que os arquivos tar.xz são 15x menores ao usar a biblioteca tar do Python em comparação com o tar do macOS? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh Como posso reduzir o consumo do processo `vmmem`? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Pesquisa do Windows 10 não está carregando, mostrando janela em branco 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve