关于【sort】的问题- 第1页

Asked: 2024-04-27 14:16:34 +0800 CST

classifique todas as matrizes em um arquivo JSON em profundidade para obter uma ordem consistente

Estou acompanhando a configuração de algum sistema no formato JSON em um sistema de controle de revisão.

Infelizmente, essa configuração é recuperada usando algum comando proprietário de código fechado, e a saída muda de uma execução para a próxima, pois a ordem nos objetos e matrizes é mais ou menos aleatória.

Uma vez, ele produzirá:

{
  "fru": [
    {
      "name": "foo",
      "attr": [
         {"name": "colour", "value": "blue"},
         {"name": "length", "value": 12}
      ]
    },
    {
      "name": "bar",
      "attr": [
         {"name": "colour", "value": "red"},
         {"name": "length", "value": 1}
      ]
    }
  ],
  "tags": ["x", "y"]
}

E da próxima vez:

{
  "tags": ["y", "x"],
  "fru": [
    {
      "name": "bar",
      "attr": [
         {"name": "length", "value": 1},
         {"name": "colour", "value": "red"}
      ]
    },
    {
      "name": "foo",
      "attr": [
         {"name": "colour", "value": "blue"},
         {"name": "length", "value": 12}
      ]
    }
  ]
}

Isso significa que, do ponto de vista de git diff, tudo muda de uma execução para outra, mesmo que seja exatamente o mesmo sistema.

Em todas as matrizes, a ordem não é relevante. A ordem também não importa nos atributos dos objetos. Então, se eu pudesse pós-processar essa saída para que os objetos e arrays tivessem seus atributos e membros em uma ordem consistente, eu garantiria que a saída não mudaria quando o sistema não mudasse e as mudanças vistas por git diffseriam mais provavelmente refletirá as mudanças no sistema.

jq -Sme ajuda bastante:

classificando atributos dentro de objetos
colocar atributos de objetos separados e membros da matriz em linhas separadas ( git diffé baseado em linhas).

Para o exemplo acima, isso me dá:

{
  "fru": [
    {
      "attr": [
        {
          "name": "colour",
          "value": "blue"
        },
        {
          "name": "length",
          "value": 12
        }
      ],
      "name": "foo"
    },
    {
      "attr": [
        {
          "name": "colour",
          "value": "red"
        },
        {
          "name": "length",
          "value": 1
        }
      ],
      "name": "bar"
    }
  ],
  "tags": [
    "x",
    "y"
  ]
}

{
  "fru": [
    {
      "attr": [
        {
          "name": "length",
          "value": 1
        },
        {
          "name": "colour",
          "value": "red"
        }
      ],
      "name": "bar"
    },
    {
      "attr": [
        {
          "name": "colour",
          "value": "blue"
        },
        {
          "name": "length",
          "value": 12
        }
      ],
      "name": "foo"
    }
  ],
  "tags": [
    "y",
    "x"
  ]
}

Isso é melhor, mas ainda não está lá, pois os arrays não estão classificados (compreensivelmente).

Observe que o arquivo da vida real é mais complexo com arrays contendo outros arrays de objetos contendo mais arrays...

Meu pensamento para resolver isso é classificar todas as matrizes, começando pelas mais profundas com base na representação da string JSON dos valores, por exemplo, .fru[0].attrclassificada com {"name": "colour", "value": "blue"}antes {"name": "length", "value": 12}porque a {"name":"colour","value":"blue"}string é classificada antes do comprimento um e, em seguida, a .frumatriz classificada com fooantes barporque {"attr":[..."blue"...(com o attratributo movido antes nameem ordem alfabética) é classificado antes {"attr":[..."red"....

Posso obter os caminhos de todos os arrays, primeiro a profundidade com:

$ jq -c '[paths(arrays)]|reverse' a
[["tags"],["fru",1,"attr"],["fru",0,"attr"],["fru"]]

Posso classificar uma matriz com base na representação da string JSON de seus membros com:

jq '.array|=sort_by(tojson)'

Mas como combinar os dois para aplicar o segundo a todos os arrays retornados pelo primeiro?

Ou existe uma maneira melhor de pós-processar esse JSON para que o pedido permaneça consistente?

Se jqnão for a melhor ferramenta para isso, ficarei feliz em considerar os módulos perldo JSONou os equivalentes Ruby/python.

superstator

Asked: 2024-01-23 02:56:25 +0800 CST

Classificação de caminho numérico multinível

Estou no Ubuntu 22 e tenho uma grande árvore de arquivos com nomes irritantes que incluem valores numéricos em várias posições. Algo como:

./2
./2/9
./2/10
./2/8
./1
./1/2
./1/1
./1/11
./11
./11/page 6
./11/page 05
./11/page 4

Quero classificar isso de acordo com os valores numéricos, ignorando qualquer coisa como 'página', para obter:

./1/1
./1/2
./1/11
./2/8
./2/9
./2/10
./11/page 4
./11/page 05
./11/page 6

Eu tentei sort -n, mas mesmo olhando apenas para os nomes dos diretórios de primeiro nível, isso não parece fazer o que eu esperava:

$ find . -mindepth 1 -type d | sort -n
./1
./11
./2

Existe uma opção útil para "classificar por cada número inteiro (não dígito)"?

motor 30

Asked: 2023-05-11 08:15:08 +0800 CST

classificar por duas colunas numéricas

Estou tentando classificar um arquivo genético com base em chr (coluna 2) e posição (coluna 3) que começam de baixo para cima. minha mesa esta assim em arquivo grande

SNP CHR BP  A1  A2  effect_allele_frequency BETA    standard_error  P
rs10875231  1   100000012   T   G   0.405   -0.0456807  0.02260471  0.04335677
rs6678176   1   100000827   C   T   0.383   0.02553138  0.02287662  0.2645817
rs78590530  1   100000948   A   G   0.016   0.171376    0.08757958  0.05035017
rs149636485 1   100001060   A   G   0.004   -0.03363731 0.1819208   0.8529224

Quero ordenar CHR (de 1 a 22) de forma que a posição também comece de baixo para cima desconsiderando outras colunas e para cada chr separadamente. Eu tentei este comando de classificação

sort -t $'\t' -nk3 myfile.tsv | sort -t $'\t' -nk2  > test.txt

dá ordem em chr (coluna 2), mas não em posição (coluna 3). parece que a coluna 1 interfere:

SNP CHR BP  A1  A2  effect_allele_frequency BETA    standard_error  P
rs1000033   1   226580387   G   T   0.416   0.02958699  0.02295015  0.1971771
rs1000050   1   162736463   T   C   0.378   0.06136397  0.02293639  0.007468015
rs1000070   1   222359612   C   T   0.381   0.02563547  0.02294139  0.2638107
rs1000073   1   157255396   G   A   0.387   -0.01470793 0.02273634  0.517414
rs1000085   1   66857915    C   G   0.024   -0.03536382 0.07555889  0.6394446
rs1000127   1   63432716    C   T   0.157   0.003052272 0.03045933  0.919875

Como posso classificar pela coluna 2 e depois apenas pela 3?

paropunam

Asked: 2023-01-17 06:58:07 +0800 CST

Por que `htop` exibe `$'\t'` como `?` no comando `sort`?

Eu estava executando um comando pipe com uma seção sendo a seguinte:

sort -t $'\t'  -T . -k1,1g

Quando eu estava monitorando, htopvi isso:

Qual é a razão por trás disso? Isso significa que meu comando está errado ou há algo errado com ele htop?

HippoMan

Asked: 2022-09-26 16:36:53 +0800 CST

/bin/sort parece ignorar barras em sua entrada

Estou executando o Ubuntu 20.0.4.

Considere este conteúdo do arquivo a seguir (suponha que o arquivo tenha o nome input) ...

/zzzzz foo bar
/hij zzz
xyz abc 
/abc 
ijk lmnop
qwer tyuiop 
abc def

Se eu executar /bin/sort input, recebo a seguinte saída ...

/abc 
abc def
/hij zzz
ijk lmnop
qwer tyuiop 
xyz abc 
/zzzzz foo bar

Como você pode ver, a barra inicial é totalmente ignorada pelo algoritmo de classificação. Não há nada na sortpágina de manual que diga algo sobre as barras sendo tratadas de qualquer forma especial.

Mas se eu substituir cada uma das barras pelo $caractere, esse comportamento não ocorre. Por exemplo, suponha que um arquivo nomeado newinputcontém esses valores ...

$zzzzz foo bar
$hij zzz
xyz abc 
$abc 
ijk lmnop
qwer tyuiop 
abc def

Em outras palavras, newinputé o mesmo que input, exceto pelo fato de que os /caracteres foram alterados para $caracteres. Quando eu faço /bin/sort newinput, eu recebo esses resultados ...

$abc 
$hij zzz
$zzzzz foo bar
abc def
ijk lmnop
qwer tyuiop 
xyz abc

Como você pode ver, nesse caso, o $é realmente tratado como um caractere normal e classificável por /bin/sort.

Então, o que está acontecendo aqui? E como faço /bin/sortpara prestar atenção ao /personagem?

Desde já agradeço qualquer ideia e sugestão.

ATUALIZAÇÃO : Se eu fizer isso no Debian, a classificação funcionará corretamente, tanto em relação a quanto /a $.

Então, eu estou querendo saber se esse comportamento pode ser um "recurso" do Ubuntu.

Chap

Asked: 2022-07-10 14:35:47 +0800 CST

Como uso a classificação em várias colunas com diferentes tipos de dados

Aqui está meu arquivo t.tsv delimitado por tabulação:

$ cat t.tsv
2022/05/05  -258.03
2022/05/07  -18.10
2022/05/09  -10.74
2022/05/09  -132.60
2022/05/12  -18.56
2022/05/12  -20.20
2022/05/17  -11.00
2022/05/17  -112.91
2022/05/17  -51.43
2022/05/17  -64.78
2022/05/18  -13.96
2022/05/18  -13.96
2022/05/18  -7.51
2022/05/19  -17.08
2022/05/20  -33.08

Estou usando a classificação do MacOS 12.4 (da página man: O utilitário de classificação é compatível com a especificação IEEE Std 1003.1-2008 (“POSIX.1”) ) para classificar primeiro por col 1 em alfa seq ascendente, depois por col2 em ascendente numérico.

$ cat t.tsv|sort --field-separator='\t' --key=1,1 --key=2,2n
2022/05/05  -258.03
2022/05/07  -18.10
2022/05/09  -10.74
2022/05/09  -132.60
2022/05/12  -18.56
2022/05/12  -20.20
2022/05/17  -11.00
2022/05/17  -112.91
2022/05/17  -51.43
2022/05/17  -64.78
2022/05/18  -13.96
2022/05/18  -13.96
2022/05/18  -7.51
2022/05/19  -17.08
2022/05/20  -33.08

Estou perplexo por que a segunda coluna não está sendo classificada em sequência numérica crescente quando a primeira coluna é a mesma. Numerosas respostas SE para essa mesma pergunta dizem que (a) você especifica colunas únicas como --key=1,1, e (b) você pode aplicar opções como -ndefinições de chave individuais como --key=2,2n.

Atualização: devo mencionar que meu shell é bash.

Yvain

Asked: 2022-05-31 11:03:27 +0800 CST

Diferença entre sort -u e uniq -u

Eu sempre usei sort -upara me livrar de duplicatas até agora.
Mas estou com uma dúvida real sobre uma lista gerada por uma ferramenta de software.
A questão é: a saída é sort -u |wca mesma que uniq -u |wc?

Porque eles não produzem os mesmos resultados. O manual para uniqespecifica:

-u, --unique apenas imprime linhas exclusivas

Minha saída consiste em 1110 palavras para as quais sort -umantém 1020 linhas e uniq -u 1110linhas, a quantidade correta. O problema é que não consigo identificar visualmente nenhuma duplicata na lista que é gerada usando >no final da linha de comando e que há um problema com o total de senhas quebradas (no contexto de personalizar john the ripper).

yael

Asked: 2022-05-18 02:42:25 +0800 CST

classificar números de acordo com o último número na linha [duplicado]

o seguinte é um exemplo de arquivo

585.3 M   netG ple jdhe jdhe_daily se 1732 pcv DC month 202204 day 20220413
585.5 M   netG ple jdhe jdhe_daily se 1734 pcv DC month 202204 day 20220413
585.8 M   netG ple jdhe jdhe_daily se 1733 pcv DC month 202204 day 20220413
585.9 M   netG ple jdhe jdhe_daily se 1731 pcv DC month 202203 day 20220304
586.1 M   netG ple jdhe jdhe_daily se 1732 pcv DC month 202203 day 20220304
586.5 M   netG ple jdhe jdhe_daily se 1735 pcv DC month 202204 day 20220413
587.1 M   netG ple jdhe jdhe_daily se 1734 pcv DC month 202203 day 20220304
587.3 M   netG ple jdhe jdhe_daily se 1733 pcv DC month 202203 day 20220304
587.4 M   netG ple jdhe jdhe_daily se 1736 pcv DC month 202204 day 20220413
587.4 M   netG ple jdhe jdhe_daily se 1737 pcv DC month 202204 day 20220413
587.7 M   netG ple jdhe jdhe_daily se 1738 pcv DC month 202204 day 20220413
588.0 M   netG ple jdhe jdhe_daily se 1735 pcv DC month 202203 day 20220304
594.3 M   netG ple jdhe jdhe_daily se 1730 pcv DC month 202205 day 20220515
594.3 M   netG ple jdhe jdhe_daily se 1737 pcv DC month 202203 day 20220303

queremos ordenar a data no último campo da data antiga para a nova data

suporte ao comando dose sortpara classificar números de acordo com o último campo?

user598527

Asked: 2022-05-13 00:42:31 +0800 CST

Como usar o Bash globbing em combinação com a expansão da chave (em classificação)?

Eu uso sortpara remover linhas duplicadas de arquivos de texto, classificar em ordem alfabética, sobrescrevendo os arquivos ( {,}no comando):

sort -u -o $HOME/Documents/notes/URLs.txt{,}

Como adicionar arquivos adicionais ao mix, depois de URLs.txt? Para ilustrar com três adicionais:

$HOME/Documents/notes/{URLs.txt,Android.txt,mpv.txt,firefox.txt}

chemacabeza

Asked: 2022-04-19 02:59:10 +0800 CST

O que acontece quando o comando sort é fornecido com o intervalo de chaves em ordem decrescente?

Estou tentando entender algo sobre o sortcomando " " e estou com dificuldades. Gostaria de uma ajuda aqui.

Eu tenho um arquivo chamado " my_file.csv" com o seguinte conteúdo (gerado por mim para apenas brincar com " sort"):

Id,RandomNumber,UUID,RandomPassword,Letters,RandomWord
1,18934,42ab7251-daaf-4a10-8349-213fef22ce78,l5ZIkKjF8QGlN9GmZ9qd,AAA,keelboatman
2,22045,bfc9d720-e8f8-406a-9841-c02edc2500bb,EPq64i1LaYTsNbB0ts78,BBB,unbinds
3,14468,b2d0f699-66c1-4571-9228-66399c1329a5,t9CzSFBZd8dS9gN3J3mO,CCC,foaminess
4,9359,4bf377b6-1b89-474f-a34b-4e5ca55f03a1,G2dwlMDdbYPUOGX68mmg,DDD,filander
5,31147,d1d9a6d4-7a8e-4fd5-a2a2-a2915614a054,ZaMw16rF3t1OjIGFc6KM,AAA,runologist
6,9909,5313eec0-99ac-4ec7-a8cf-7ee8847f98d4,VeZhlqMEDvAderKvB8qk,BBB,upgathering
7,10228,7e2e7cdf-b38a-4014-8235-c6f351068a14,A9EmNnksYK0AE9DVQcEG,CCC,nondiaphanousness
8,22815,75962dfe-cfd1-42cb-b14d-96dd8a01a165,Qy1NyB3xnkuhEH1Gh7Pb,DDD,extirpate
9,12688,c25c9468-83f7-4751-82c6-c150e538207b,wDSlIMIne6hQ8B7OIYip,AAA,aldamine
10,4133,f683f78a-f627-48aa-91b2-6f449f56fb23,LhxaoVi1fV7kFhFwXATA,DDD,underhole

Se eu quisesse classificar o conteúdo deste arquivo usando a quinta coluna, eu usaria o seguinte:

$ tail -n +2 my_file.csv | sort -t, -k5,5
1,18934,42ab7251-daaf-4a10-8349-213fef22ce78,l5ZIkKjF8QGlN9GmZ9qd,AAA,keelboatman
5,31147,d1d9a6d4-7a8e-4fd5-a2a2-a2915614a054,ZaMw16rF3t1OjIGFc6KM,AAA,runologist
9,12688,c25c9468-83f7-4751-82c6-c150e538207b,wDSlIMIne6hQ8B7OIYip,AAA,aldamine
2,22045,bfc9d720-e8f8-406a-9841-c02edc2500bb,EPq64i1LaYTsNbB0ts78,BBB,unbinds
6,9909,5313eec0-99ac-4ec7-a8cf-7ee8847f98d4,VeZhlqMEDvAderKvB8qk,BBB,upgathering
3,14468,b2d0f699-66c1-4571-9228-66399c1329a5,t9CzSFBZd8dS9gN3J3mO,CCC,foaminess
7,10228,7e2e7cdf-b38a-4014-8235-c6f351068a14,A9EmNnksYK0AE9DVQcEG,CCC,nondiaphanousness
10,4133,f683f78a-f627-48aa-91b2-6f449f56fb23,LhxaoVi1fV7kFhFwXATA,DDD,underhole
4,9359,4bf377b6-1b89-474f-a34b-4e5ca55f03a1,G2dwlMDdbYPUOGX68mmg,DDD,filander
8,22815,75962dfe-cfd1-42cb-b14d-96dd8a01a165,Qy1NyB3xnkuhEH1Gh7Pb,DDD,extirpate

Se eu quisesse classificar o mesmo arquivo usando uma segunda chave, digamos que a segunda coluna (que são números) eu usaria o seguinte:

$ tail -n +2 my_file.csv | sort -t, -k5,5 -k2n,2
9,12688,c25c9468-83f7-4751-82c6-c150e538207b,wDSlIMIne6hQ8B7OIYip,AAA,aldamine
1,18934,42ab7251-daaf-4a10-8349-213fef22ce78,l5ZIkKjF8QGlN9GmZ9qd,AAA,keelboatman
5,31147,d1d9a6d4-7a8e-4fd5-a2a2-a2915614a054,ZaMw16rF3t1OjIGFc6KM,AAA,runologist
6,9909,5313eec0-99ac-4ec7-a8cf-7ee8847f98d4,VeZhlqMEDvAderKvB8qk,BBB,upgathering
2,22045,bfc9d720-e8f8-406a-9841-c02edc2500bb,EPq64i1LaYTsNbB0ts78,BBB,unbinds
7,10228,7e2e7cdf-b38a-4014-8235-c6f351068a14,A9EmNnksYK0AE9DVQcEG,CCC,nondiaphanousness
3,14468,b2d0f699-66c1-4571-9228-66399c1329a5,t9CzSFBZd8dS9gN3J3mO,CCC,foaminess
10,4133,f683f78a-f627-48aa-91b2-6f449f56fb23,LhxaoVi1fV7kFhFwXATA,DDD,underhole
4,9359,4bf377b6-1b89-474f-a34b-4e5ca55f03a1,G2dwlMDdbYPUOGX68mmg,DDD,filander
8,22815,75962dfe-cfd1-42cb-b14d-96dd8a01a165,Qy1NyB3xnkuhEH1Gh7Pb,DDD,extirpate

Agora vou mais a fundo e tento ordenar o mesmo conteúdo pela quinta coluna e usando o 2º e 3º dígito da RandomNumbercoluna. Para isso eu usaria algo assim:

$ tail -n +2 my_file.csv | sort -t, -k5,5 -k2.2n,2.3
5,31147,d1d9a6d4-7a8e-4fd5-a2a2-a2915614a054,ZaMw16rF3t1OjIGFc6KM,AAA,runologist
9,12688,c25c9468-83f7-4751-82c6-c150e538207b,wDSlIMIne6hQ8B7OIYip,AAA,aldamine
1,18934,42ab7251-daaf-4a10-8349-213fef22ce78,l5ZIkKjF8QGlN9GmZ9qd,AAA,keelboatman
2,22045,bfc9d720-e8f8-406a-9841-c02edc2500bb,EPq64i1LaYTsNbB0ts78,BBB,unbinds
6,9909,5313eec0-99ac-4ec7-a8cf-7ee8847f98d4,VeZhlqMEDvAderKvB8qk,BBB,upgathering
7,10228,7e2e7cdf-b38a-4014-8235-c6f351068a14,A9EmNnksYK0AE9DVQcEG,CCC,nondiaphanousness
3,14468,b2d0f699-66c1-4571-9228-66399c1329a5,t9CzSFBZd8dS9gN3J3mO,CCC,foaminess
10,4133,f683f78a-f627-48aa-91b2-6f449f56fb23,LhxaoVi1fV7kFhFwXATA,DDD,underhole
8,22815,75962dfe-cfd1-42cb-b14d-96dd8a01a165,Qy1NyB3xnkuhEH1Gh7Pb,DDD,extirpate
4,9359,4bf377b6-1b89-474f-a34b-4e5ca55f03a1,G2dwlMDdbYPUOGX68mmg,DDD,filander

Agora, o que estou tentando entender agora é como algo assim funciona:

$ tail -n +2 my_file.csv | sort -t, -k5,5 -k2.4n,2.1

$ tail -n +2 my_file.csv | sort -t, -k5,5 -k5.3,4.3

Em ambos os casos, o início da segunda chave é DEPOIS do final da chave ( 2.4vs 2.1em um caso e 5.3vs 4.3no outro).

Gostaria de entender como funcionam os seguintes casos:

Início da tecla após o término da tecla (por exemplo: -k2.4n,2.1)
Chave começando em um campo e terminando em um campo que aparece antes (por exemplo: -k6,5)
Tecla começando em um caractere dentro de um campo e terminando em um caractere de um campo que aparece antes (por exemplo: -k6.4,5.3)

Muito obrigado antecipadamente!

classifique todas as matrizes em um arquivo JSON em profundidade para obter uma ordem consistente

Classificação de caminho numérico multinível

classificar por duas colunas numéricas

Por que `htop` exibe `$'\t'` como `?` no comando `sort`?

/bin/sort parece ignorar barras em sua entrada

Como uso a classificação em várias colunas com diferentes tipos de dados

Diferença entre sort -u e uniq -u

classificar números de acordo com o último número na linha [duplicado]

Como usar o Bash globbing em combinação com a expansão da chave (em classificação)?

O que acontece quando o comando sort é fornecido com o intervalo de chaves em ordem decrescente?

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Perguntas[sort](unix)