AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1638009
Accepted
Roxion
Roxion
Asked: 2021-03-30 12:14:01 +0800 CST2021-03-30 12:14:01 +0800 CST 2021-03-30 12:14:01 +0800 CST

Extraindo links específicos do código-fonte na linha de comando do linux

  • 772

Eu tenho um arquivo de texto de código-fonte de 3000 linhas de uma página. Como posso extrair URLs específicos semelhantes aos abaixo e excluir o código-fonte restante?

https://d17nygptf7ayu.cloudfront.net/photos/0b1983ccf6bb5674f93b.jpg

Como eu fui através do código, existem 60 links semelhantes ao link acima com apenas alteração nos nomes *.jpg.

como iniciante, tenho menos ideia por onde começar e qual ferramenta devo usar na linha de comando do linux. Também como posso fazer isso no notepad ++?

Regex eu inventohttps\://d17nygptf7ayu\.cloudfront\.net/photos/(?:(?!\.jpg)(?:.|\n))*\.jpg

regex text-editing
  • 1 1 respostas
  • 141 Views

1 respostas

  • Voted
  1. Best Answer
    bitinerant
    2021-03-30T22:03:16+08:002021-03-30T22:03:16+08:00

    Essa expressão regular corresponderá aos URLs que você deseja:

    https\://d17nygptf7ayu\.cloudfront\.net/photos/[0-9a-f]{20}.jpg
    

    O [0-9a-f]acima corresponde a qualquer dígito hexadecimal minúsculo e {20}corresponde exatamente a 20 deles.

    A ferramenta Linux clássica e muito útil que pesquisa com base em expressões regulares é o grep. Um geralmente usa o -Esinalizador, o que faz com que ele use expressões regulares estendidas. O -osinalizador faz com que ele produza apenas a string correspondente. (Normalmente grepproduziria a linha inteira que contém a string correspondente.) Para uma descrição completa de como usar grep, digite man grep.

    Então, para gerar uma lista de todos os URLs correspondentes:

    grep -Eo 'https\://d17nygptf7ayu\.cloudfront\.net/photos/[0-9a-f]{20}.jpg' long_text_file.html >output_list_of_urls.txt

    Observe que, se o arquivo que você listou no lugar output_list_of_urls.txtjá existir, ele será substituído. Observe também que a expressão regular está entre aspas. Se seus nomes de arquivo de entrada ou saída contiverem espaços ou outros caracteres especiais, eles também precisam de aspas.

    • 1

relate perguntas

  • Como extrair nomes de arquivos vazios de uma lista de caminhos de arquivo usando regexes

  • Notepad ++ excluir até dois pontos para cada linha com substituir tudo

  • Powershell e regex: lista de arquivos "backup ao salvar" do Notepad ++. Editar nome, classificar por lastwritetime

  • Existe um .gitignore para OneDrive?

  • Como parar de pesquisar se uma string ocorrer antes de outra string no Regex

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como posso reduzir o consumo do processo `vmmem`?

    • 11 respostas
  • Marko Smith

    Baixar vídeo do Microsoft Stream

    • 4 respostas
  • Marko Smith

    O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

    • 6 respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Martin Hope
    Saaru Lindestøkke Por que os arquivos tar.xz são 15x menores ao usar a biblioteca tar do Python em comparação com o tar do macOS? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh Como posso reduzir o consumo do processo `vmmem`? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Pesquisa do Windows 10 não está carregando, mostrando janela em branco 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    v15 Por que uma conexão de Internet gigabit/s via cabo (coaxial) não oferece velocidades simétricas como fibra? 2020-01-25 08:53:31 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve