AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / 问题

Perguntas[grep](unix)

Martin Hope
Tim Osborn
Asked: 2025-02-13 20:22:38 +0800 CST

grep -c fornece uma contagem diferente para grep | wc -l

  • 7

Eu esperava que esses dois comandos fornecessem a mesma contagem de quantas linhas no meu arquivo contêm uma letra:

grep -c '[A-Z,a-z]' archive_for_TO.050225
11873
grep '[A-Z,a-z]' archive_for_TO.050225 | wc -l
11859

O arquivo é muito grande para ser postado aqui, mas eu me pergunto se há alguns casos/explicações comuns sobre o porquê de o segundo comando aparentemente encontrar 14 linhas correspondentes a menos que o primeiro. Por exemplo, isso indica que o arquivo de texto tem algumas inconsistências em como as linhas são separadas (retorno de caractere ou avanço de linha ou ambos)?

grep
  • 1 respostas
  • 118 Views
Martin Hope
J Telep
Asked: 2025-01-30 04:19:30 +0800 CST

Combinando grep com o comando find

  • 5

Estou tentando remover lixo dos diretórios rsyslog (principalmente muitos subdiretórios vazios ou subdiretórios com um único arquivo de log parcial), mas com todos os tipos de nomes diferentes, variando de palavras que parecem ter sido cortadas a 10 hifens. Pensei que a maneira mais fácil de fazer isso seria simplesmente procurar por qualquer coisa que eu precisasse e dizer que todo o resto é lixo, mas é aí que fica complicado.

Eu preciso manter

  • os 5-10 arquivos/subdiretórios padrão que vêm como padrão sempre que eu crio um novo ouvinte rsyslog
  • qualquer diretório que seja um nome de host (qualquer subdiretório que comece com "vd" ou "vp")
  • qualquer diretório que seja um endereço IP.

Qualquer outra coisa pode ser excluída.

Eu considerei usar apenas grep e excluir qualquer coisa que correspondesse a esses termos de pesquisa e então ter uma listagem de diretório em um arquivo de texto que eu poderia usar como uma lista de entrada para remover, mas estou tendo problemas com os nomes de host, assim que eu digo "vp*" não recebo nada de volta. Além disso, a string que estou usando para puxar os endereços IP também está pegando datas.

Minha pesquisa atual se parece com:

egrep -av 'HEAD|GET|version|putenv|id|default|POST|status|rsyslog_stats' |
    grep -E "[^^][0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}" |
    grep -av "vp*" |
    grep -av "vd*"

Se alguém tiver alguma sugestão, eu agradeceria muito. Se eu conseguisse fazer isso funcionar, eu poderia executá-lo a cada 15-30 minutos e manter todos os meus diretórios de ouvintes do rsyslog limpos e não ingerir tanto lixo nos meus índices do Splunk.

Obrigado!

grep
  • 1 respostas
  • 52 Views
Martin Hope
Zac Helmberger
Asked: 2025-01-16 10:55:24 +0800 CST

Pesquisando entradas exclusivas em um arquivo

  • 5
Esta pergunta foi migrada do Server Fault porque pode ser respondida no Unix & Linux Stack Exchange. Migrada há 3 dias .

Estou usando Arch Linux/Debian Linux e quero uma lista de "identificadores" únicos em um arquivo ASCII txt. Aqui está um trecho dos dados que quero reduzir:

... (Received from VRW): wind ...
... (Received from 1a00): air_ ...
... (Received from 5710): air_ ...
... (Received from ####): air_ ...
... (Received from 15d8): air_ ...
... (Received from ####): air_ ...
... (Received from 6e9e): baro ...
... (Received from 6e9e): volt ...
... (Received from 6e9e): wind ...
... (Received from 6e9e): air_ ...

Devido ao grande tamanho do arquivo e aos inúmeros "identificadores" duplicados, quero gerar apenas identificadores exclusivos para que a saída fique assim:

... (Received from VRW): wind ...
... (Received from 1a00): air_ ...
... (Received from 5710): air_ ...
... (Received from ####): air_ ...
... (Received from 15d8): air_ ...
... (Received from 6e9e): baro ...

Melhor ainda seria simplesmente a lista de identificadores exclusivos, como 15d8, 6e9e, VRW, etc. Mas suspeito que isso seria muito mais difícil de fazer.

Das sugestões de perguntas semelhantes anteriores que tentei:

grep "(Received from" datafile.txt

e obtive uma lista enorme de identificadores, a maioria dos quais são repetições.

Eu também tentei:

grep "(Received from" datafile.txt | sort -u

mas não consegui dizer se fez alguma diferença

Eu também tentei:

parallel --tag --lb grep "Received from" {} | perl -ne '$seen{$_}++ or print;' ::: Data1.txt

o que provavelmente demonstra meu nível de ignorância nesses assuntos.

grep
  • 3 respostas
  • 50 Views
Martin Hope
athos
Asked: 2024-12-05 18:36:20 +0800 CST

Para criar um alias para grep e incluir diretórios

  • 5

Frequentemente, uso grep para procurar algum texto em várias pastas, por exemplo

grep --include='*.csv' -nRHI --color=always 'pattern' Folder1 Folder2  

Gostaria de criar um alias algo como

alias MyGrep="grep --include='*.csv' -nRHI --color=always Folder1 Folder2"

para que da próxima vez que eu tiver algo para pesquisar, eu só precise

MyGrep 'pattern'

Entretanto, isso não funciona, pois o padrão de pesquisa precisa vir antes da lista de pastas.

Existe alguma solução alternativa para o alias?

ps. Posso usar uma função em vez disso, por exemplo

function MyGrep() { grep --include='*.csv' -nRHI --color=always "$@" Folder1 Folder2;}

então eu posso correr

MyGrep pattern

Mas estou curioso para saber se há uma solução alternativa via alias.

grep
  • 1 respostas
  • 21 Views
Martin Hope
Dominic van der Zypen
Asked: 2024-11-21 21:51:59 +0800 CST

Por que o caractere especial `?` precisa ser escapado no grep, mas não `.` ou `*`?

  • 10

O único arquivo no meu diretório de trabalho atual é chamado test.txte seu conteúdo é simplesmente:

This is a little test file.
  • Executando
    grep -in * -e 'te.?t file'
    
    não dá nenhuma partida .
  • Mas escapar ?funciona:
    grep -in * -e 'te.\?t file'
    
    dá partida

Louco: Com a estrela *, as coisas são ao contrário!

  • Sem escapar:
    grep -in * -e 'te.*t file'
    
    dá partida
  • e escapar *não funciona:
    grep -in * -e 'te.\*t file'
    
    nenhuma partida

Por que os metacaracteres ?e são *tratados de forma diferente em relação ao escape?

grep
  • 2 respostas
  • 180 Views
Martin Hope
Lucas Rey
Asked: 2024-11-20 13:24:46 +0800 CST

Campos específicos do grep Tshark

  • 5

Estou usando o tshark para decodificar rapidamente o protocolo SMPP, por exemplo:

tshark -i any -V -Y smpp

Isso mostrará, em tempo real, cada pacote SMPP, por exemplo

Short Message Peer to Peer, Command: Submit_sm, Seq: 8475778, Len: 215
    Length: 215
    Operation: Submit_sm (0x00000004)
    Sequence #: 8475778
    Service type: (Default)
    Type of number (originator): Alphanumeric (0x05)
    Numbering plan indicator (originator): Unknown (0x00)
    Originator address: \123\110\123\123\123aaa\123
    Type of number (recipient): Unknown (0x00)
    Numbering plan indicator (recipient): ISDN (E163/E164) (0x01)
    Recipient address: 44123456789
    .... ..00 = Messaging mode: Default SMSC mode (0x00)
    ..00 00.. = Message type: Default message type (0x00)
    00.. .... = GSM features: No specific features selected (0x00)
    Protocol id.: 0x43

Existe uma maneira de grep campos específicos e gerar somente estes? Eu tentei com:

tshark -i any -V -Y smpp | grep 'Operation|Type of number|Numbering plan indicator|Recipient address'

Mas não funciona. Eu tentei também com:

tshark -i any -V -Y smpp -T fields -e 'smpp.dest_addr_ton' -e 'smpp.destination_addr'

Mas isso produzirá apenas o valor e eu gostaria de produzir algo como;

Type of number (recipient): Unknown (0x00)
Numbering plan indicator (recipient): ISDN (E163/E164) (0x01)
Recipient address: 44123456789

Alguém poderia me dar um conselho? Obrigado, Lucas

grep
  • 1 respostas
  • 11 Views
Martin Hope
Sistemas Libsur
Asked: 2024-09-17 02:41:42 +0800 CST

regex para detectar duas linhas consecutivas que tenham as mesmas palavras na mesma ordem, mas espaços diferentes no início, no final e entre as palavras

  • 5

Quero encontrar um regex ou perl oneliner para detectar duas linhas consecutivas que tenham as mesmas palavras na mesma ordem, mas os espaços iniciais, finais e a quantidade de espaços entre as palavras podem variar de uma linha para a outra. O regex deve excluir as linhas que não correspondem.

Eu uso essa regex para detectar linhas consecutivas idênticas.
^\s*(.*\S)(\s\n*\1)+$
Ela falha quando a quantidade de espaço em branco varia de uma linha para outra.

Eu tenho este texto de exemplo

Mary has a little lamb. The live near the mountain.
Mary has a little lamb. The live near the mountain.

vrfgrgru hfiughf iujhfuihgifughuir nuhuvhfug

Mary has  a little lamb. The live near the mountain.
  Mary has a little lamb. The live near the mountain.

 Mary has a little lamb.  The live near the mountain.
Mary has a little lamb. The live near the mountain.

fghurhg bojghirejyohi ndhguhyituhgi
gbshbsiughsf bnighriugh hurhgiurhgriu

 Elvis was the greatest singer of all time. He has 18 number one in billboard charts.
Elvis was the greatest singer  of all time. He has 18 number one in billboard charts.

sgfuhgdugusd vfjsng orjgoergo ejfio dsmnjn
fbdhsbfgdbhhbfhdsfdf

Mary has a little lamb. The live near the mountain.
 Mary has a little lamb. The live near the mountain.

gsete gerttrb oijoijoijoijoijoiojo gogoerijoi

jhoiyrei  erogjrijgtrio noifdo mkooi 

This has been the coldest winter in the last 20 years.
 This has  been the coldest winter in the  last 20 years.

Independentemente do número de espaços nas linhas, a regex deve exibir as linhas consecutivas que contêm as mesmas informações.

Não há três em uma fileira e não há linhas vazias entre as linhas correspondentes.

grep
  • 1 respostas
  • 89 Views
Martin Hope
An5Drama
Asked: 2024-07-27 13:29:47 +0800 CST

Existe uma ferramenta regex seguindo apenas BRE e gerando erros quando indefinida?

  • 5

Estou lendo Design de Software para Flexibilidade (SDF) . O Exercício 2.10 pede para implementar o tradutor tanto para BRE quanto para ERE. O livro usa greppara testar a string traduzida como (a.c)em ERE para capturar algo como abcou adc.

Eu uso Arch Linux.


Pela especificação POSIX 9.3.3 BRE Special Characters, \+não é suportado pelo BRE.

Mas man grep"Expressões Regulares Básicas vs Estendidas" permite \+a opção padrão BRE .

A diferença acima parece estar implícita neste problema de especificações (referência deste controle de qualidade ):

O BRE corresponde ao tipo ed ou grep histórico

Mas edparece também apoiar\+ .


(Editado: este parágrafo está errado, pois este site não está em conformidade com o BRE quando a opção b está habilitada. (ab)Em vez de \(ab\)corresponderá a "ab".) https://www.regexplanet.com/advanced/postgresql/index.html pode suportar o mero BRE, mas é um pouco lento e não pode ser facilmente incorporado ao código do Scheme (estou aprendendo SICP e SDF, então não verifiquei a implementação do Http no Scheme. O livro acima usa shell para executargrep ). Eu uso expressão a\+ce entrada abcpara testar com a opção b habilitada. Mostra "regex_matches()" sendo "(nenhum)".

Então existe uma ferramenta regex seguindo exatamente o BRE?

grep
  • 1 respostas
  • 123 Views
Martin Hope
John Gordon
Asked: 2024-07-18 23:49:34 +0800 CST

padrão grep para encontrar palavras no código

  • 3

Estou procurando um padrão grep para encontrar ocorrências de uma palavra em algum código (Python, se for importante).

Quero ignorar ocorrências que estejam dentro de uma palavra mais longa, dentro de strings ou dentro de comentários (se possível).

Então, se eu tivesse este código Python:

Variable = 5
print(Variable)
MyVariablePlusOne = 6
description = "This is Variable"
# I love Variable

Eu quero uma maneira de fazer grep Variableque corresponda apenas às duas primeiras linhas.

grep
  • 2 respostas
  • 60 Views
Martin Hope
palmasd1
Asked: 2024-06-02 21:42:21 +0800 CST

É possível ler a entrada do usuário sem variáveis ​​extras?

  • 4

Quero inserir um endereço IP dentro dos arquivos de configuração do Nginx. Quero inserir o endereço IP com o readcomando, mas não quero armazenar a entrada em uma variável adicional. Então eu quero algo como:

grep -ir $(read) /etc/nginx/

Qual é a maneira correta de usar reado argumento interno?

grep
  • 1 respostas
  • 68 Views

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve