remova o número de linhas duplicadas com base na correspondência antes da primeira vírgula

Question

motor 30

Asked: 2022-10-01 10:05:59 +0800 CST2022-10-01 10:05:59 +0800 CST 2022-10-01 10:05:59 +0800 CST

reformatar valores numéricos para dois valores

772

Eu tenho um arquivo enorme com valores numéricos em muitas colunas e linhas. Os valores nas colunas após a coluna 6 são todos numéricos mais ausentes como NA ( 0ou 1ou 2ou NA).

Gostaria de alterar os valores em todas as colunas da coluna 7 em diante desta forma: 0to A A, 1to A B, 2to B Be NAto 0 0. Desta forma, o cabeçalho da coluna 7, será duas vezes para cada um. Posso fazer isso usando awk? Meu arquivo de entrada é assim, mas muitas colunas depois disso. Meu arquivo de saída deve ser delimitado por tabulação.

id1 id2 parental    maternal    sex phenotype   A_101   A_102   A_103   
20907153    20907153    0   0   -9  -9  1   0   0   0   0   0   
31405729    31405729    0   0   -9  -9  0   0   0   0   0   0   
31450731    31450731    0   0   -9  -9  0   0   0   2   0   0   
41940308    41940308    0   0   -9  -9  0   0   0   NA  0   0   
52428081    52428081    0   0   -9  -9  0   0   0   0   0   0   
41943104    41943104    0   0   -9  -9  0   0   0   0   0   0

1 respostas

Voted

Davey · Answer 1 · 2022-10-01T13:58:29+08:00

Best Answer

Davey

2022-10-01T13:58:29+08:002022-10-01T13:58:29+08:00

Meio longo, mas direto:

awk '{ for (i=7; i<=NF; i++) { if ($i=="0"){ sub(0,"A A",$i) } else if ($i=="1"){ sub(1,"A B",$i) } else if ($i=="2") {sub(2,"B B",$i) } else if ($i=="NA") { sub("NA","0 0",$i) }} print $0}' inputfile.txt

Faz um loop sobre cada campo se o número do campo >= 7, se corresponder a uma de suas condições, substitui o campo pelo par correspondente. Imprime a linha completa após o loop.

Para mim isso retorna:

id1 id2 parental    maternal    sex phenotype   A_101   A_102   A_103
20907153 20907153 0 0 -9 -9 A B A A A A A A A A A A
31405729 31405729 0 0 -9 -9 A A A A A A A A A A A A
31450731 31450731 0 0 -9 -9 A A A A A A B B A A A A
41940308 41940308 0 0 -9 -9 A A A A A A 0 0 A A A A
52428081 52428081 0 0 -9 -9 A A A A A A A A A A A A
41943104 41943104 0 0 -9 -9 A A A A A A A A A A A A

1

reformatar valores numéricos para dois valores

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

reformatar valores numéricos para dois valores

1 respostas

relate perguntas