AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / user-361114

Paolo Lorenzini's questions

Martin Hope
Paolo Lorenzini
Asked: 2025-04-18 00:09:08 +0800 CST

editar todos os valores em uma coluna específica com base no intervalo de números de linha

  • 6

Tenho um arquivo PDB (coordenadas de átomos em uma proteína) em uma máquina Linux:

ATOM      1   N  GLY A   1       0.535  51.766   5.682  1.00  0.00              
ATOM      2  CA  GLY A   1      -0.712  50.962   5.596  1.00  0.00              
ATOM      3   C  GLY A   1      -1.243  50.872   4.179  1.00  0.00              
ATOM      4   O  GLY A   1      -1.313  51.888   3.492  1.00  0.00              
ATOM      5   N  GLN A   2      -1.600  49.664   3.737  1.00  0.00              
ATOM      6  CA  GLN A   2      -2.221  49.468   2.423  1.00  0.00              
ATOM      7   C  GLN A   2      -3.542  48.719   2.507  1.00  0.00              
ATOM      8   O  GLN A   2      -3.722  47.844   3.356  1.00  0.00              
ATOM      9  CB  GLN A   2      -1.280  48.738   1.468  1.00  0.00              
ATOM     10  CG  GLN A   2      -0.976  47.294   1.830  1.00  0.00              
....     ..  ..   .. .   .       ....   ....     ....   ....  ....
TER   SPLIT LINE FOR INTERNAL USE ONLY
ATOM      1  O5'  G  A   1     -44.412  97.503  31.177  1.00  0.00              
ATOM      2  C5'  G  A   1     -45.447  96.803  31.882  1.00  0.00              
ATOM      3  C4'  G  A   1     -45.225  95.295  31.894  1.00  0.00              
ATOM      4  O4'  G  A   1     -46.441  94.578  31.654  1.00  0.00              
ATOM      5  C3'  G  A   1     -44.328  94.850  30.748  1.00  0.00              
ATOM      6  O3'  G  A   1     -42.943  94.877  31.129  1.00  0.00              
ATOM      7  C2'  G  A   1     -44.804  93.425  30.542  1.00  0.00              
ATOM      8  O2'  G  A   1     -44.163  92.592  31.466  1.00  0.00              
ATOM      9  C1'  G  A   1     -46.304  93.444  30.772  1.00  0.00              
ATOM     10  N9   G  A   1     -46.965  93.699  29.495  1.00  0.00
....     ..  ..   .  .   .     .......  ......   .....  ....   ...

O registro TER marca explicitamente o fim de uma cadeia de aminoácidos específica. Quero alterar o ID da cadeia da proteína na quinta coluna pelo awk para atribuir o ID correto à nova cadeia após TER.

Resultado esperado:

ATOM      1   N  GLY A   1       0.535  51.766   5.682  1.00  0.00              
ATOM      2  CA  GLY A   1      -0.712  50.962   5.596  1.00  0.00              
ATOM      3   C  GLY A   1      -1.243  50.872   4.179  1.00  0.00              
ATOM      4   O  GLY A   1      -1.313  51.888   3.492  1.00  0.00              
ATOM      5   N  GLN A   2      -1.600  49.664   3.737  1.00  0.00              
ATOM      6  CA  GLN A   2      -2.221  49.468   2.423  1.00  0.00              
ATOM      7   C  GLN A   2      -3.542  48.719   2.507  1.00  0.00              
ATOM      8   O  GLN A   2      -3.722  47.844   3.356  1.00  0.00              
ATOM      9  CB  GLN A   2      -1.280  48.738   1.468  1.00  0.00              
ATOM     10  CG  GLN A   2      -0.976  47.294   1.830  1.00  0.00                 
TER   SPLIT LINE FOR INTERNAL USE ONLY
ATOM      1  O5'  G  B   1     -44.412  97.503  31.177  1.00  0.00              
ATOM      2  C5'  G  B   1     -45.447  96.803  31.882  1.00  0.00              
ATOM      3  C4'  G  B   1     -45.225  95.295  31.894  1.00  0.00              
ATOM      4  O4'  G  B   1     -46.441  94.578  31.654  1.00  0.00              
ATOM      5  C3'  G  B   1     -44.328  94.850  30.748  1.00  0.00              
ATOM      6  O3'  G  B   1     -42.943  94.877  31.129  1.00  0.00              
ATOM      7  C2'  G  B   1     -44.804  93.425  30.542  1.00  0.00              
ATOM      8  O2'  G  B   1     -44.163  92.592  31.466  1.00  0.00              
ATOM      9  C1'  G  B   1     -46.304  93.444  30.772  1.00  0.00              
ATOM     10  N9   G  B   1     -46.965  93.699  29.495  1.00  0.00  

Tudo precisa ser separado com os mesmos espaços, o seguinte arranjo estaria errado:

ATOM   3674  CD1 PHE A 460       2.350  79.471  35.466  1.00  0.00              
ATOM   3675  CD2 PHE A 460       1.037  81.443  35.196  1.00  0.00              
ATOM   3676  CE1 PHE A 460       2.425  79.321  34.080  1.00  0.00              
ATOM   3677  CE2 PHE A 460       1.108  81.298  33.805  1.00  0.00              
ATOM   3678  CZ  PHE A 460       1.805  80.232  33.250  1.00  0.00              
TER SPLIT LINE FOR B USE ONLY
ATOM 1 O5' G B 1 -44.412 97.503 31.177 1.00 0.00
ATOM 2 C5' G B 1 -45.447 96.803 31.882 1.00 0.00
ATOM 3 C4' G B 1 -45.225 95.295 31.894 1.00 0.00
ATOM 4 O4' G B 1 -46.441 94.578 31.654 1.00 0.00
ATOM 5 C3' G B 1 -44.328 94.850 30.748 1.00 0.00

Além disso, o arquivo termina com isto:

TER
ENDMDL

Há uma linha em branco no final do arquivo que precisa ser deixada como está

text-processing
  • 3 respostas
  • 61 Views
Martin Hope
Paolo Lorenzini
Asked: 2022-03-08 00:59:58 +0800 CST

imprimir parte do nome do arquivo no meio

  • 0

Tenho vários arquivos com nomes como:

ID_Italy.txt
ID2_USA.txt
ID3_Germany.txt
.....

se eu quiser imprimir antes do _ eu posso fazer:

for file in *.txt; do print "${file%_*}";done

Resultado:

ID
ID2
ID3

Se eu quiser imprimir e remover a extensão:

for file in *.txt; do print "${file%.*}";done

Resultado:

ID_Italy
ID2_USA
ID3_Germany

No entanto, gostaria de levar apenas o que estiver entre _ e . e ter a seguinte saída:

Italy
USA
Germany

Como imprimir isso?

filenames
  • 5 respostas
  • 134 Views
Martin Hope
Paolo Lorenzini
Asked: 2020-01-12 00:01:59 +0800 CST

Linhas de subconjunto de vários quadros de dados com base em valores de variáveis ​​em duas colunas

  • 0

Eu tenho vários quadros de dados que se parecem com isso:

df1

col1;col2;col3;col4
cat;1;2;blue
house;1;2;red
dog;5;6;yellow
mouse;7;8;white

df2

col1;col2;col3;col4
cat;3;4;grey
house;7;8;red
dog;5;6;yellow
mouse;3;4;black

df3

col1;col2;col3;col4
cat;5;6;grey
house;3;4;red
dog;5;6;yellow
mouse;9;10;grey

Eu gostaria de subconjunto todas as linhas onde os valores de col2 e col3 são iguais ao valor de col2 e col3 de "cat" Os valores de col2 e col3 continuam mudando em cada quadro de dados, então não são constantes. A saída seria:

df1

col1;col2;col3;col4
cat;1;2;blue
house;1;2;red

df2

col1;col2;col3;col4
cat;3;4;grey
mouse;3;4;black

df3

col1;col2;col3;col4
cat;5;6;grey
dog;5;6;yellow

Alguma sugestão? Na verdade, posso usar o tempo todo awk:

awk -F";" '{if($2=="1" && $3=="2")print $0}' df1 
awk -F";" '{if($2=="3" && $3=="4")print $0}' df2
awk -F";" '{if($2=="5" && $3=="6")print $0}' df3

mas eu tenho milhares de quadros de dados, então é problemático inserir manualmente os valores para cada linha de código

linux shell
  • 1 respostas
  • 172 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-10-02 02:44:55 +0800 CST

grep pares de padrões e arquivo

  • 4

Tenho um arquivo (search.patterns) com uma lista de padrões a serem pesquisados ​​em uma lista de outros arquivos txt.

padrões de pesquisa

home
dog 
cat

arquivo 1.txt

home 3
tiger 4
lion 1

arquivo 2.txt

dolphin 6
jaguar 3
dog 1

arquivo 3.txt

donkey 3
cat 4
horse 1

então eu quero que a primeira linha do arquivo padrão seja pesquisada no arquivo1, a segunda linha pesquisada no arquivo2 e a terceira linha no arquivo3

Resultado:

home 3
dog 1
cat 4

Eu escrevi um código assim:

for f in *.txt;
    do 
    while IFS= read -r LINE; 
        do grep -f "$LINE" "$f" > "$f.out"
    done < search.patterns
done

No entanto, os arquivos de saída estão vazios

Qualquer ajuda, muito apreciada, obrigado

linux
  • 3 respostas
  • 599 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-07-24 08:00:37 +0800 CST

Salvar cada linha de arquivo em diferentes variáveis ​​e usar cada variável uma a uma na entrada e saída da linha de comando

  • 1

Eu sou novo em scripts de shell, então peço desculpas se isso foi perguntado antes.

Eu tenho um arquivo de coordenadas.txt assim:

765442
866447
755343
097754

Gostaria de passar cada valor de cada linha do arquivo para uma variável e usar esses valores um a um como entrada em uma linha de comando e salvar esse número em parte do nome do arquivo. Eu escrevi o seguinte código, mas não tenho certeza se este é o caminho correto a seguir ...

cat coordinates.txt | while read LINE; do
    var="$(echo $LINE)"
    /home/users/scripts/TreeView/TreeView.sh -o $NAME_ALL.chr1.new_estimate.trees.$var --bp_of_interest $var
done

então na saída -o cada valor um de cada vez é anexado ao nome do arquivo e cada valor também é usado como --bp_of_interest, um de cada vez

Qualquer sugestão muito apreciada. Obrigado

shell-script shell
  • 1 respostas
  • 289 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-07-12 10:48:44 +0800 CST

Substitua a substring de caracteres por awk e sed

  • 1

Eu tenho um arquivo que contém uma string muito longa de caracteres e gostaria de substituir uma substring dele por Ns. Exemplo:

teste

ABCDABCDABCD

Eu gostaria de substituir uma substring dela por todas as letras N com o comando awk e sed, todos os caracteres do índice 5 a 8, então o comprimento total da letra N é 4.

Resultado

ABCDNNNNABCD

Eu tentei algo assim:

awk '{ v=substr($0,5,4); sed -i "s/$v/N/g";print substr($0,1,4)""v""substr($0,9,12)}' test

no entanto, este comando parece dar esta saída:

ABCDABCDABC

E nenhuma substituição foi feita

Eu gostaria de ter no código o número do índice de onde começar a substituição, (aqui, por exemplo, é 5) e o número do comprimento da substituição (aqui 4), para que eu possa modificar esses números caso Eu quero começar em outra posição e para um comprimento diferente de substituições porque, na realidade, tenho uma string com milhares de letras e quero substituir centenas de caracteres, então a substituição de padrão não funciona no meu caso

linux text-processing
  • 5 respostas
  • 12836 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-07-12 05:18:43 +0800 CST

Substituir caractere com base no intervalo de coordenadas

  • 0

Oi eu tenho um arquivo de texto com milhares de linhas que se parece com isso:

NNNNN
NNNNN
NNNNN
NNNNN

Eu gostaria de substituir com base em sua localização coordenar todas as letras dentro de um intervalo específico para outra letra, digamos que eu queira substituir todas as N letras da posição do intervalo 10 para a posição 13 para a letra P, a saída será:

NNNNN
NNNNP
PPPNN
NNNNN

Alguma sugestão sobre o comando que eu poderia usar?

linux text-processing
  • 2 respostas
  • 205 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-07-12 02:52:37 +0800 CST

Substituindo todos os caracteres no arquivo de texto por um caractere específico

  • 0

Eu tenho um arquivo que se parece com:

arquivo.txt

NNNP
PPZL
ZZNN

Eu gostaria de substituir todas as letras para "N" e ter uma saída assim com o mesmo número de linhas que a entrada: (meu arquivo aqui tem 3 linhas, mas na realidade, meu arquivo tem milhares de linhas)

NNNN
NNNN
NNNN

De fato, posso apenas criar um novo arquivo com este comando:

printf %4s | tr " " "N" > file2.txt
yes "$(<file2.txt)" | head -n3

No entanto, alguém sabe se existe uma maneira mais simples de substituir todas as letras de uma só vez e manter a mesma matriz de colunas e linhas?

linux text-processing
  • 2 respostas
  • 2725 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-07-09 09:26:20 +0800 CST

anexe nomes de vários arquivos .txt e renomeie o arquivo de destino de concatenação

  • 2

Sou novo em scripts de shell bash, peço desculpas se isso já foi solicitado.

Eu tenho combinações de vários arquivos, como:

USA.txt Florida.txt Miami.txt

Eu gostaria de juntar esses arquivos e criar um novo arquivo que contém tudo, como:

cat *.txt > USA_FLORIDA_MIAMI.txt

Em outro caso O problema é que em algum outro momento os arquivos têm um prefixo diferente:

Canada.txt Quebec.txt Montreal.txt

então neste segundo caso, a saída será CANADA_QUEBEC_MONTREAL.txt:

cat *.txt > CANADA_QUEBEC_MONTREAL.txt

e assim por diante para todas as combinações de outros arquivos

No primeiro cenário, USA.txt Florida.txt Miami.txt são os únicos arquivos .txt presentes no diretório. No segundo caso, eles serão substituídos por Canada.txt Quebec.txt Montreal.txt, então eu precisaria escrever um código que sempre combinasse as informações do prefixo de todos os arquivos .txt presentes naquele momento no diretório e adiciona-o ao prefixo do arquivo de saída. A variável aqui é o nome do País, Estado e Cidade.

Alguma sugestão sobre qualquer comando que eu poderia usar? obrigado

linux text-processing
  • 2 respostas
  • 611 Views
Martin Hope
Paolo Lorenzini
Asked: 2019-07-08 11:20:33 +0800 CST

Cole valores em uma nova coluna a cada enésima linha

  • 0

Eu tenho um arquivo.txt assim:

1
2
3
4
5
6

se eu quiser adicionar valor (Apple) em uma nova coluna com o comando awk eu posso fazer isso:

awk -v RS='\r\n' 'BEGIN { OFS = " " } {print $0, "Apple"}' file.txt > file_new.txt

que dará:

1 Apple
2 Apple
3 Apple
4 Apple
5 Apple
6 Apple

Agora, vamos supor que eu gostaria de ter esta saída:

1 Apple
2 Apple
3 Orange
4 Orange
5 Banana
6 Banana

Como modificar o comando awk?

linux
  • 2 respostas
  • 124 Views

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve