AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 1161951
Accepted
Zulakis
Zulakis
Asked: 2024-07-03 19:59:01 +0800 CST2024-07-03 19:59:01 +0800 CST 2024-07-03 19:59:01 +0800 CST

Como a classificação compara strings?

  • 772

Eu esperaria que o bash sort comparasse strings como esta:

  • Comece no primeiro caractere (de ambas as strings)
  • Se os caracteres forem iguais, prossiga para o próximo caractere
  • Se eles forem desiguais, retorne o resultado maior/menor para o algoritmo de classificação
  • Se não houver mais caracteres, retorne igual

Por alguma razão, parece que este não é o caso.

Vamos pegar a seguinte entrada:

a
b
.
-

Isso é classificado por bash sort como

-
.
a
b

Agora, para entrada

b.de
bb.de

Eu esperaria o seguinte resultado de classificação:

b.de
bb.de

Porque o primeiro caractere é igual, e para o segundo caractere, .vem antes b(como visto no primeiro teste).

Por alguma razão, este não é o caso, as strings são classificadas assim:

bb.de
b.de

Por que está sortse comportando dessa maneira e existe uma maneira de fazer com que ele se comporte "conforme o esperado"?

Eu testei os mesmos exemplos com python e python classifica conforme esperado.

bash
  • 2 2 respostas
  • 155 Views

2 respostas

  • Voted
  1. Best Answer
    Jasen
    2024-07-03T21:07:59+08:002024-07-03T21:07:59+08:00

    Classificar por padrão faz uma classificação com reconhecimento de localidade que usa as regras lexicográficas de sua localidade. veja strcoll(3)

    ltrace(3) me deu isto:

    strcoll("b.de", "bb.de") = 20

    comparações com reconhecimento de localização parecem dividir as strings em palavras e classificá-las. já que as palavras nunca começam com '.' sort vê palavras com 0 lenfgh e as coloca no início da lista. no entanto '.' é colocado em palavras, por exemplo: "Jr." "Ph.D"

    se você precisar de uma comparação de bytes, exporte LC_COLLATE=C ou LC_COLLATE=POSIX

    • 3
  2. Matthew Ife
    2024-07-03T20:22:59+08:002024-07-03T20:22:59+08:00

    Eu verifiquei o coreutilspacote e se você não fornecer nenhum argumento, parece que ele (eventualmente) usa a strcmprotina C. O único caso que não é verdade é quando os valores nas linhas podem ser interpretados como números inteiros.

    A página de manual da qual diz:

    Na glibc, como na maioria das outras implementações, o valor de retorno é o resultado aritmético da subtração do último byte comparado em s2 do último byte comparado em s1. (Se os dois caracteres forem iguais, essa diferença será 0.)

    Isso significa que o strcmpof bb.dee b.derealmente se resume ao último caractere.

    Isso é if 'd' < 'e'o que (pelo menos em ascii) seria if 100 < 101o que é verdade.

    • -1

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve