o que grep -v grep faz

Question

Paolo Lorenzini

Asked: 2020-01-12 00:01:59 +0800 CST2020-01-12 00:01:59 +0800 CST 2020-01-12 00:01:59 +0800 CST

Linhas de subconjunto de vários quadros de dados com base em valores de variáveis em duas colunas

772

Eu tenho vários quadros de dados que se parecem com isso:

df1

col1;col2;col3;col4
cat;1;2;blue
house;1;2;red
dog;5;6;yellow
mouse;7;8;white

df2

col1;col2;col3;col4
cat;3;4;grey
house;7;8;red
dog;5;6;yellow
mouse;3;4;black

df3

col1;col2;col3;col4
cat;5;6;grey
house;3;4;red
dog;5;6;yellow
mouse;9;10;grey

Eu gostaria de subconjunto todas as linhas onde os valores de col2 e col3 são iguais ao valor de col2 e col3 de "cat" Os valores de col2 e col3 continuam mudando em cada quadro de dados, então não são constantes. A saída seria:

df1

col1;col2;col3;col4
cat;1;2;blue
house;1;2;red

df2

col1;col2;col3;col4
cat;3;4;grey
mouse;3;4;black

df3

col1;col2;col3;col4
cat;5;6;grey
dog;5;6;yellow

Alguma sugestão? Na verdade, posso usar o tempo todo awk:

awk -F";" '{if($2=="1" && $3=="2")print $0}' df1 
awk -F";" '{if($2=="3" && $3=="4")print $0}' df2
awk -F";" '{if($2=="5" && $3=="6")print $0}' df3

mas eu tenho milhares de quadros de dados, então é problemático inserir manualmente os valores para cada linha de código

1 respostas

Voted

RudiC · Answer 1 · 2020-01-12T03:48:02+08:00

Best Answer

RudiC

2020-01-12T03:48:02+08:002020-01-12T03:48:02+08:00

Que tal

awk -F\; '                              # set field separator
FNR == 1        {D1 = D2 = ""           # on new file (= line No. 1), reset variables
                 FN = FILENAME "_tmp"   # compose new filename
                 print > FN             # print header line to new file
                }
/^cat/          {D2 = $2                # if found "cat", set variables D2 and 
                 D3 = $3                # D3
                }
$2 == D2 &&                             # if fields $2 and $3 match variables, i.e. $2 and $3 from "cat" line
$3 == D3        {print > FN             # print line to new file
                }
' df*                                   # work on every "df*" file in sight

Então mvo arquivo *tmp sobre os originais...

1

Linhas de subconjunto de vários quadros de dados com base em valores de variáveis em duas colunas

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Linhas de subconjunto de vários quadros de dados com base em valores de variáveis ​​em duas colunas

1 respostas

relate perguntas

Linhas de subconjunto de vários quadros de dados com base em valores de variáveis em duas colunas