Subtraindo a mesma coluna entre duas linhas no awk

Question

Vladislavs Dovgalecs

Asked: 2019-09-06 15:37:15 +0800 CST2019-09-06 15:37:15 +0800 CST 2019-09-06 15:37:15 +0800 CST

Embaralhar palavras em uma string

772

Eu tenho um arquivo de texto com strings delimitadas por nova linha. Meu problema é processar cada linha da seguinte forma: embaralhar a ordem dos tokens usando o espaço como delimitador.

Por exemplo:

Entrada: A B C

Resultado: C A B

Executar o comando/script repetidamente deve, obviamente, fornecer uma ordem diferente.

Minha solução atual (para uma única linha de texto):

$ cat <file> | tr " " "\n" | shuf | tr "\n" " "

Existe uma combinação de linha de comando legal (melhor) para processar um arquivo de texto com várias linhas?

7 respostas

Voted

Stéphane Chazelas · Answer 1 · 2019-09-06T23:48:17+08:00

Best Answer

Stéphane Chazelas

2019-09-06T23:48:17+08:002019-09-06T23:48:17+08:00

POSIXly, você poderia fazê-lo com awkrelativa eficiência (certamente mais eficiente do que executar pelo menos um shufutilitário GNU para cada linha da entrada) como:

awk '
  BEGIN {srand()}
  {
    for (i = 1; i <= NF; i++) {
      r = int(rand() * NF) + 1
      x = $r; $r = $i; $i = x
    }
    print
  }' < your-file

(observe que na maioria das awkimplementações, executar o mesmo comando duas vezes no mesmo segundo provavelmente fornecerá o mesmo resultado que a semente aleatória padrão usada srand()geralmente com base no tempo de época atual em segundos).

6

Zhenhir · Answer 2 · 2019-09-06T16:14:20+08:00

Seu comando original pode ser simplificado para

shuf -e A B C | tr "\n" " " && echo ""

ou

shuffled=( $(shuf -e A B C) ) ; echo ${shuffled[*]}

O que eu acho um pouco menos hacky e também é mais rápido dos meus testes rudimentares.

Se você tiver um arquivo no ~/testqual contém

A B C
D E F

Você pode embaralhar e ecoar cada linha com o seguinte comando

while IFS= read -r line; do shuffled=( $(shuf -e $line) ) ; echo ${shuffled[*]} ; done < ~/test

ou em forma de script:

#!/bin/bash
while IFS= read -r line
    do shuffled=( $(shuf -e $line) )
    echo ${shuffled[*]}
done < ~/test

Onde você pode querer substituir ~/testpara $1passar argumentos para o script.

resultado:

B C A
G E F

Como isso funciona:

shuf -edivide em espaços assim como em novas linhas... mas apenas porque tratará ABC como três argumentos.

então shuf -e A B C irá embaralhar AB e C, mas shuf -e "A B C" não irá embaralhar AB e C

Podemos usar isso para ler cada linha em uma matriz e depois imprimi-la novamente com echo.

while IFS= read -r line;

Lê em cada linha $linequando é passado <para este loop.

do shuffled=( $(shuf -e $line) )

Faz uma matriz de cada linha na $shuffledvariável, literalmente expandindo shuf -e $linepara shuf -e A B C.

echo ${shuffled[*]}

ecoa nossa matriz, por padrão, imprimindo cada elemento com espaços entre eles

< ~/test

alimenta as linhas do ~/testnosso loop.

steeldriver · Answer 3 · 2019-09-06T16:24:39+08:00

steeldriver

2019-09-06T16:24:39+08:002019-09-06T16:24:39+08:00

Dado

$ cat file
A B C
D E F
G H I J

em seguida, usando shuffledo módulo List::Util do perl:

$ perl -MList::Util=shuffle -alpe '$_ = join " ", shuffle @F' file
C B A
E D F
I J G H

Com bash read -ae shuf(mas muito ineficiente, pois executa 3 utilitários por linha, 2 dos quais não embutidos):

$ while read -ra arr; do shuf -e -- "${arr[@]}" | paste -sd ' ' -; done < file
A C B
F E D
J I G H

3

Quora Feans · Answer 4 · 2019-09-06T16:15:01+08:00

Quora Feans

2019-09-06T16:15:01+08:002019-09-06T16:15:01+08:00

Para passar os parâmetros como uma linha:

shuf -e one two three fouré o que você precisa.

shuf -e $(cat <file>) | tr "\n" " "para um arquivo com uma linha, como no seu exemplo.

Para várias linhas:

while read line; do shuf -e $line | tr "\n" " " && echo \n; done < <file>

1

Stéphane Chazelas · Answer 5 · 2019-09-06T23:30:33+08:00

Stéphane Chazelas

2019-09-06T23:30:33+08:002019-09-06T23:30:33+08:00

Enquanto como @steeldriver, eu usaria uma ferramenta de processamento de texto adequada perlpara fazer o trabalho , vou mencionar uma maneira hacky com o zshshell:

while read -rA words; do
  print -r -- /(e['reply=($words)']noe['REPLY=$RANDOM'])
done < your-file

É um pouco de hack. Acabamos usando a geração de nome de arquivo para poder usar o oqualificador glob que nos permite implementar ordens de classificação arbitrárias.

Aqui, estamos globbing /(que sabemos que sempre existe), usamos um equalificador glob para substituí-lo pelo conteúdo de nossa matriz e, em seguida, fazemos uma nordem onumérica com base na REPLY=$RANDOM eexpressão.

1

Rakesh Sharma · Answer 6 · 2019-09-07T01:00:45+08:00

Rakesh Sharma

2019-09-07T01:00:45+08:002019-09-07T01:00:45+08:00

Aqui está uma maneira de fazer isso usando o c-shell "muito difamado":

% foreach line ( "`cat input.txt`" )
     set tokens = ( $line:x )
     foreach ran_idx ( `seq $#tokens | shuf` )
         printf '%s\n' ${tokens[$ran_idx]:q}
     end
end

0

Teshan Shanuka J · Answer 7 · 2021-03-19T22:15:20+08:00

Teshan Shanuka J

2021-03-19T22:15:20+08:002021-03-19T22:15:20+08:00

Aqui está um mais simples. Coloque sua string em uma matriz e use shufpara embaralhar

SA=($"A B C")
shuf -e ${SA[@]}

0

Embaralhar palavras em uma string

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Embaralhar palavras em uma string

7 respostas

relate perguntas