AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 76968878
Accepted
user14714429
user14714429
Asked: 2023-08-24 19:38:11 +0800 CST2023-08-24 19:38:11 +0800 CST 2023-08-24 19:38:11 +0800 CST

Contando ocorrências de string na segunda coluna que corresponde às primeiras colunas de um arquivo [fechado]

  • 772
Fechado . Esta questão precisa ser mais focada . No momento não está aceitando respostas.

Quer melhorar esta questão? Atualize a pergunta para que ela se concentre apenas em um problema editando esta postagem .

Fechado há 11 horas .

Melhore esta questão

Eu tenho este arquivo de texto de entrada:

CD196_RS15035       normal alleles
CD196_RS15035       normal alleles
CD196_RS15035       truncation in the allele
CD196_RS15035       truncation in the allele
CD196_RS15035       no stop for allele
CD196_RS15035       no stop for allele
CD196_RS16835       normal alleles
CD196_RS16835       truncation in the allele
CD196_RS16835       no stop for allele
CD196_RS16835       no stop for allele

Quero contar o número de vezes que cada string ocorre na segunda coluna que corresponde à primeira coluna.

Quero um arquivo de texto de saída como este:

CD196_RS15035  normal alleles  2    truncation in the allele   2    no stop for allele  2
 
CD196_RS16835  normal alleles  1    truncation in the allele   1    no stop for allele  2

Qualquer dica seria útil. Obrigado.

linux
  • 3 3 respostas
  • 32 Views

3 respostas

  • Voted
  1. Best Answer
    RomanPerekhrest
    2023-08-24T20:07:22+08:002023-08-24T20:07:22+08:00

    Com awka matriz multidimensional de:

    awk -F'[ ]{2,}'
      '{ a[$1][$2]+=1 }
       END{ 
           for (i in a) { 
               printf("%s ", i);
               for (j in a[i]) printf("%s %d ", j, a[i][j]); 
               print "";  
           }
       }'
      test.txt
    

    CD196_RS15035 normal alleles 2 no stop for allele 2 truncation in the allele 2 
    CD196_RS16835 normal alleles 1 no stop for allele 2 truncation in the allele 1 
    
    • 1
  2. jared_mamrot
    2023-08-24T20:19:26+08:002023-08-24T20:19:26+08:00

    Uma opção potencial poderia ser 'construir' cada linha percorrendo as variáveis, por exemplo

    awk 'BEGIN {
        FS = OFS = "\t"
    }
    
    {
        a[$1 FS $2]++
        b[$1]
        c[$2]
    }
    
    END {
        for (i in b) {
            output = i
            for (j in c) {
                output = output FS j FS a[i FS j]
            }
            print output
        }
    }' file.txt
    CD196_RS15035   normal alleles  2   no stop for allele  2   truncation in the allele    2
    CD196_RS16835   normal alleles  1   no stop for allele  2   truncation in the allele    1
    
    • 1
  3. Thor
    2023-08-24T20:44:48+08:002023-08-24T20:44:48+08:00

    Supondo que as colunas sejam delimitadas por tabulações, você poderia fazer isso com datamash:

    datamash groupby 1,2 count 2  |
    
    # Join 2nd column and its count
    sed 's/\t/ /2'                |
    
    # Collapse on the 1st column
    datamash groupby 1 collapse 2
    

    Saída:

    CD196_RS15035   normal alleles 2,truncation in the allele 2,no stop for allele 2
    CD196_RS16835   normal alleles 1,truncation in the allele 1,no stop for allele 2
    
    • 1

relate perguntas

  • Extraia valores de saída do arquivo de imagem de disco como strings no Linux [fechado]

  • Precisa de ajuda para executar um comando envolvendo várias aspas simples e duplas na linha de comando do Windows via bsub

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve