AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77700117
Accepted
pedro
pedro
Asked: 2023-12-22 03:24:39 +0800 CST2023-12-22 03:24:39 +0800 CST 2023-12-22 03:24:39 +0800 CST

String reversa em campos específicos com condição

  • 772

Eu tenho esse arquivo:

m64071_220512_054244/12584899/ccs rev pet047-10055 ACGTGCGACCTTGTGA TTGAGGGTTCAAACGTGCGACCTTGTGA
m64071_220512_054244/128321000/ccs rev pet047-10055 ACGTGCGACCTTGTGA TTGAGGGTTCAAACGTGCGACCTTGTGA
m64071_220512_054244/132186699/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
m64071_220512_054244/134874748/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA

Eu preciso tre reverseos campos $4 e $5 somente se$2==rev

Esperar :

m64071_220512_054244/12584899/ccs rev pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
m64071_220512_054244/128321000/ccs rev pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
m64071_220512_054244/132186699/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
m64071_220512_054244/134874748/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA

Tentei :

perl -lpe 'if(/rev/) {$rev=/rev/;next}; if ($rev) {$F[4,5]=~tr/ATGC/TACG/; $F[4,5]=reverse $F[4,5]; print "@F"}' file 

Eu também tentei usar o awk ( Execute o comando bash dentro do awk e imprima a saída do comando )

awk '{
            if($2==rev)
        {
            cmd1="echo \047" $4 "\047 | rev | tr \047ATGC\047 \047TACG\047" 
            cmd2="echo \047" $5 "\047 | rev | tr \047ATGC\047 \047TACG\047"
            newVar1=((cmd1 | getline line) > 0 ? line : "failed") 
            newVar2=((cmd2 | getline line) > 0 ? line : "failed")
            close(cmd)
            print $1, $2, $3, newVar1, newVar2
        }
        else {print}
}' file
bash
  • 4 4 respostas
  • 78 Views

4 respostas

  • Voted
  1. Best Answer
    zdim
    2023-12-22T04:31:01+08:002023-12-22T04:31:01+08:00

    Para seguir a tentativa da pergunta:

    perl -w -lanE'
        if ($F[1] eq "rev") { 
            for (@F[3,4]) { tr/ATGC/TACG/; $_ = reverse $_ } 
        } 
        say "@F"
    ' file
    

    Posso colocar isso em uma linha (ou copiar e colar como está na maioria dos shells), espalhei-o para facilitar a leitura. Ou coloque em um programa, claro, principalmente se houver mais o que fazer.


    Editar - comentários sobre o código da pergunta

    • Para dividir a string de entrada no @Farray (" autosplit "), é necessário -asinalizar

    • Como você está imprimindo explicitamente o que é necessário, use -no sinalizador, não-p

    • Os campos 4 e 5 na linha são os elementos 3 e 4 da matriz

    • Presumo que $F[4,5]você queira dizer os dois elementos da matriz (que devem ser 3,4). Isso, então, deveria ser @F[3,4]- e com -wbandeira, como aviso, ouviríamos sobre isso

    • Mais importante ainda, não podemos vincular uma expressão regular ou trpadrão a uma lista, mas apenas a um único escalar. Para aplicar isso tra vários itens, é necessário iterar sobre eles, como acima.

    • O código no bloco desse loop sobre os @F[3,4]elementos é executado em cada elemento da matriz e o modifica no local (já que $_é apenas um alias para os elementos da matriz), primeiro com tr(revertendo e) atribuindo. Tudo o que também pode ser escrito como

      $_ = reverse tr/ATGC/TACG/r  for @F[3,4];
      

      O rmodificador trretorna a string alterada, que é então reverse-ed e atribuída de volta ao elemento da matriz atualmente processado, por meio do $_alias para ela

    • 3
  2. Alex Reynolds
    2023-12-22T04:09:33+08:002023-12-22T04:09:33+08:00

    Aqui está uma maneira de fazer isso em Python:

    #!/usr/bin/env python
    
    import io
    import sys
    
    RECORDS_STR = '''m64071_220512_054244/12584899/ccs rev pet047-10055 ACGTGCGACCTTGTGA TTGAGGGTTCAAACGTGCGACCTTGTGA
    m64071_220512_054244/128321000/ccs rev pet047-10055 ACGTGCGACCTTGTGA TTGAGGGTTCAAACGTGCGACCTTGTGA
    m64071_220512_054244/132186699/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/134874748/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA'''
    
    '''
    fast pure-Python reverse complement, courtesy of Devon Ryan
    ref. https://bioinformatics.stackexchange.com/a/3585/776
    '''
    DNA_TABLE = str.maketrans("ACTGactg", "TGACtgac")
    def reverse_complement(seq):
        return seq.translate(DNA_TABLE)[::-1]
    
    def main():
        records = io.StringIO(RECORDS_STR) # replace with sys.stdin etc.
        for line in records:
            elems = line.rstrip().split()
            if elems[1] == 'rev':
                elems[3] = reverse_complement(elems[3])
                elems[4] = reverse_complement(elems[4])
            sys.stdout.write('{}\n'.format('\t'.join(elems)))
    
    if __name__ == "__main__":
        main()
    

    Saída:

    m64071_220512_054244/12584899/ccs   rev pet047-10055    TCACAAGGTCGCACGT    TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/128321000/ccs  rev pet047-10055    TCACAAGGTCGCACGT    TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/132186699/ccs  fwd pet047-10055    TCACAAGGTCGCACGT    TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/134874748/ccs  fwd pet047-10055    TCACAAGGTCGCACGT    TCACAAGGTCGCACGTTTGAACCCTCAA
    
    • 2
  3. Kaz
    2023-12-22T08:08:01+08:002023-12-22T08:08:01+08:00

    No TXR Lisp, usando a awkmacro:

    (awk ((equal [f 1] "rev")
          (each ((i 3..5))
            (upd [f i] (mapcar (relate "ATGC" "TACG")) reverse)))
         (t))
    
    txr rev.tl data
    m64071_220512_054244/12584899/ccs rev pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/128321000/ccs rev pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/132186699/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
    m64071_220512_054244/134874748/ccs fwd pet047-10055 TCACAAGGTCGCACGT TCACAAGGTCGCACGTTTGAACCCTCAA
    
    $ diff <(txr rev.tl data) expected
    $
    
    • 1
  4. Supertech
    2023-12-22T11:12:58+08:002023-12-22T11:12:58+08:00

    Se você quiser experimentar o Bipython (eu recomendo fortemente quando você trabalha com sequências de ácidos nucléicos), aqui está uma maneira de fazer isso:

    from Bio.Seq import Seq
    import re
    
    with open("input_file.txt") as f:
        for line in f:
            line = line.rstrip() # remove new line
            fields = re.split('\s', line)
            if fields[1] != 'rev':
                print(line)
            else:
                dna = Seq(fields[3])
                print(' '.join(fields[0:3]), dna.reverse_complement(), fields[4])
    
    • 0

relate perguntas

  • (macOS Bash) 2 strings aparentemente idênticas não são iguais, mostrando apenas diferenças com "set -x"

  • Xargs: a substituição do alias falha apesar de expandir o alias

  • Diferença entre $PATH e ${PATH:+:${PATH}} em ambientes Linux

  • awk localize e substitua por regex e variável de ambiente

  • Como preencher nomes de arquivo com zeros de strings alfanuméricas numeradas e delimitadas de comprimento arbitrário no bash?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve