AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1703029
Accepted
kelalaka
kelalaka
Asked: 2022-02-04 11:53:39 +0800 CST2022-02-04 11:53:39 +0800 CST 2022-02-04 11:53:39 +0800 CST

Existe um limite para um comprimento de linha para o comando grep processar corretamente?

  • 772

Enquanto estou verificando os resultados da minha implementação do biostar para pesquisar primos em um arquivo fasta, vi um resultado estranho. Eu originalmente um arquivo de 70 colunas e o converti em um arquivo que possui 6077828 caracteres em uma única linha.

Quando eu usei o comando grep

grep -o -P -b -n CAATCGCCGT fasta.txt

Ele exibe duas correspondências que não são exibidas na minha implementação do Biostar.

3:3206721:CAATCGCCGT
3:4140348:CAATCGCCGT

Procurei a cartilha com Kate no arquivo original e não encontrei. É possível que a cartilha se espalhe em duas linhas devido à divisão de 70 colunas do texto.

Então eu os converti em números de linha e coluna com div e mod

  • 3206572 representa a linha 45808 e a coluna 12
  • 4140199 representa a linha 59145 e a coluna 49

A cartilha, no entanto, não estava lá.

Existe um limite para a linha máxima que o grep pode processar? Em caso afirmativo, quando o limite excede, os resultados são confiáveis ​​até o tamanho limite?


  • Meu arquivo de exemplo pode ser acessado no github
  • An, o arquivo de uma linha lá também.
ubuntu grep
  • 1 1 respostas
  • 885 Views

1 respostas

  • Voted
  1. Best Answer
    Kamil Maciorowski
    2022-02-04T13:54:56+08:002022-02-04T13:54:56+08:00

    No geral

    A especificação POSIX degrep afirma que

    ARQUIVOS DE ENTRADA
    Os arquivos de entrada devem ser arquivos de texto.

    Isso significa grepque deve lidar com arquivos de texto de forma confiável ( "deverá" significa "comportamento obrigatório" ). Arquivos que não são arquivos de texto podem ou não ser manipulados de forma confiável, o comportamento não é especificado.

    Um "arquivo de texto" aqui significa [ênfase minha]:

    Um arquivo que contém caracteres organizados em zero ou mais linhas. As linhas não contêm caracteres NUL e nenhuma pode exceder {LINE_MAX}bytes de comprimento, incluindo o caractere <newline>. Embora o POSIX.1-2017 não faça distinção entre arquivos de texto e arquivos binários (consulte o padrão ISO C), muitos utilitários só produzem resultados previsíveis ou significativos ao operar em arquivos de texto. Os utilitários padrão que têm essas restrições sempre especificam "arquivos de texto" em suas seções STDIN ou INPUT FILES.

    {LINE_MAX}é explicado aqui :

    {LINE_MAX}
    Salvo indicação em contrário, o comprimento máximo, em bytes, da linha de entrada de um utilitário (entrada padrão ou outro arquivo), quando o utilitário é descrito como processamento de arquivos de texto. O comprimento inclui espaço para a <nova linha> à direita.
    Valor Mínimo Aceitável:{_POSIX2_LINE_MAX}

    {_POSIX2_LINE_MAX}
    Salvo indicação em contrário, o comprimento máximo, em bytes, da linha de entrada de um utilitário (entrada padrão ou outro arquivo), quando o utilitário é descrito como processamento de arquivos de texto. O comprimento inclui espaço para a <nova linha> à direita.
    Valor: 2048

    Tudo isso significa que uma implementação de greppode manipular incorretamente linhas mais longas do que {LINE_MAX}para o sistema fornecido e ainda pode ser chamada de "portátil". {LINE_MAX}pode ser tão baixo quanto 2048.

    Tenha em mente que não é como se alguém tivesse criado a especificação e os mantenedores de diferentes implementações greplutassem para se conformar. É o contrário: as principais implementações existentes foram examinadas, o conjunto comum de recursos encontrado e documentado. Pode ser algum necessário para recuperar um pouco. Alguns podem ser muito mais poderosos; e alguns podem ter sido considerados não importantes desde o início, menos capazes por qualquer motivo, com motivos para não alcançá-los.

    De uma forma ou de outra, você pode esperar que seja grepfornecido com um sistema operacional orientado para POSIX (como Linux) e especialmente com um sistema operacional certificado para POSIX (como macOS) para lidar de forma confiável com linhas de até 2048 bytes de comprimento que não contêm caracteres NUL. Se greppuder lidar com linhas mais longas, trate-o como um bônus.

    A resposta geral para "existe um limite para o comprimento da linha?" é: sim, pode haver, depende da implementação; mas se houver um limite, deve ser de pelo menos 2048 bytes. O comportamento para linhas mais longas não é especificado.


    Em particular

    Você marcou o Ubuntu . Ubuntu vem com GNU grep. GNU grep afirma isso :

    Embora grepespere fazer a correspondência no texto, ele não tem limites no comprimento da linha de entrada além da memória disponível e pode corresponder a caracteres arbitrários em uma linha.

    • 3

relate perguntas

  • Integração com putty e Ubuntu

  • Não é possível abrir a porta entre o Windows 10 e a VM do Ubuntu hospedada localmente criada no Hyper-v

  • Erro ssh do contêiner do Docker: ssh_exchange_identification: conexão fechada pelo host remoto

  • O apache2 pode funcionar sem arquivos conf?

  • pasta compartilhada vmwared não está funcionando

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como posso reduzir o consumo do processo `vmmem`?

    • 11 respostas
  • Marko Smith

    Baixar vídeo do Microsoft Stream

    • 4 respostas
  • Marko Smith

    O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

    • 6 respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Martin Hope
    Saaru Lindestøkke Por que os arquivos tar.xz são 15x menores ao usar a biblioteca tar do Python em comparação com o tar do macOS? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh Como posso reduzir o consumo do processo `vmmem`? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Pesquisa do Windows 10 não está carregando, mostrando janela em branco 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    v15 Por que uma conexão de Internet gigabit/s via cabo (coaxial) não oferece velocidades simétricas como fibra? 2020-01-25 08:53:31 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve