AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / ubuntu / Perguntas / 1244980
Accepted
MichaelB
MichaelB
Asked: 2020-05-30 11:02:32 +0800 CST2020-05-30 11:02:32 +0800 CST 2020-05-30 11:02:32 +0800 CST

ecoar todos os URLs correspondentes a regex

  • 772

Para um projeto em que estou trabalhando, preciso obter uma lista de todos os URLs em uma determinada pasta de um domínio, ou melhor ainda, todos os URLs correspondentes a uma expressão regular.

Eu quero fazer isso usando o bash para evitar a instalação de programas que eu nunca vou usar, mas se houver uma solução usando programas que eu já tenha, como o FireFox, vá em frente e me diga.

Obrigado pelo seu tempo.

bash webserver https
  • 1 1 respostas
  • 395 Views

1 respostas

  • Voted
  1. Best Answer
    MichaelB
    2020-06-01T07:18:12+08:002020-06-01T07:18:12+08:00

    Eu descobri como gerenciar isso no meu caso, muito deve ser o mesmo para qualquer outra pessoa, você deve poder adaptar esse processo para trabalhar com qualquer URL.

    1. Mude para um novo diretório
      Primeiro devemos mudar para um novo diretório para evitar que os arquivos se percam ou sejam mantidos depois que precisarmos deles.
      mkdir ~/Desktop/dev
      cd ~/Desktop/dev
    2. Obter URLs comwget
      Next usamos o wgetcomando para encontrar todas as URLs para arquivos e pastas no domínio, para mim o comando foi:
      wget -o ./urls.txt --spider -r --reject="index.html" --no-verbose --no-parent https://downloads.tuxfamily.org/godotengine/
      Basta substituir a URL no comando acima e ele deve criar um arquivo de texto ( urls.txt) cheio de URLs e um monte de outras bobagens.
    3. Remover pasta deixada porwget
      wget terá deixado para trás uma pasta chamada qualquer que seja o domínio do seu URL de entrada. Não há informações importantes nesta pasta, então vá em frente e remova-a com o rmcomando ou através do seu gerenciador de arquivos.
    4. Construir um regex para extrair as URLs reais
      Essa é a parte difícil, recomendo abrir urls.txtem uma edição de texto ou que permita encontrar com regexs e abrir regex no seu navegador, agora você tem que construir um . Depois de encontrar uma regex que corresponda às URLs, execute o comando:
      grep -o -E "(https.*\/([0-9](\.[0-9])+)\/(mono\/)?Godot_v\2[-_]stable[_-](mono_)?((win)?(x11[\._])?(osx\.?)?)((32)?(64)?)?((\.exe)?(\.fat)?)\.zip)" ./urls.txt >> urls\ filtered.txt
      Isso copiará todas as linhas correspondentes à regex para um arquivo de texto ( urls filtered.txt). Substitua a regex (o bit entre aspas) por sua regex.

    Depois de tudo isso, você deve ficar com um arquivo de texto de todas as URLs necessárias.

    • 0

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Existe um comando para listar todos os usuários? Também para adicionar, excluir, modificar usuários, no terminal?

    • 9 respostas
  • Marko Smith

    Como excluir um diretório não vazio no Terminal?

    • 4 respostas
  • Marko Smith

    Como descompactar um arquivo zip do Terminal?

    • 9 respostas
  • Marko Smith

    Como instalo um arquivo .deb por meio da linha de comando?

    • 11 respostas
  • Marko Smith

    Como instalo um arquivo .tar.gz (ou .tar.bz2)?

    • 14 respostas
  • Marko Smith

    Como listar todos os pacotes instalados

    • 24 respostas
  • Martin Hope
    Flimm Como posso usar o docker sem sudo? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    led-Zepp Como faço para salvar a saída do terminal em um arquivo? 2014-02-15 11:49:07 +0800 CST
  • Martin Hope
    ubuntu-nerd Como descompactar um arquivo zip do Terminal? 2011-12-11 20:37:54 +0800 CST
  • Martin Hope
    TheXed Como instalo um arquivo .deb por meio da linha de comando? 2011-05-07 09:40:28 +0800 CST
  • Martin Hope
    Ivan Como listar todos os pacotes instalados 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    David Barry Como determino o tamanho total de um diretório (pasta) na linha de comando? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher "Os seguintes pacotes foram retidos:" Por que e como resolvo isso? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford Como os PPAs podem ser removidos? 2010-07-30 01:09:42 +0800 CST

Hot tag

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve