Como posso usar o docker sem sudo?

Question

MichaelB

Asked: 2020-05-30 11:02:32 +0800 CST2020-05-30 11:02:32 +0800 CST 2020-05-30 11:02:32 +0800 CST

ecoar todos os URLs correspondentes a regex

772

Para um projeto em que estou trabalhando, preciso obter uma lista de todos os URLs em uma determinada pasta de um domínio, ou melhor ainda, todos os URLs correspondentes a uma expressão regular.

Eu quero fazer isso usando o bash para evitar a instalação de programas que eu nunca vou usar, mas se houver uma solução usando programas que eu já tenha, como o FireFox, vá em frente e me diga.

Obrigado pelo seu tempo.

1 respostas

Voted

MichaelB · Answer 1 · 2020-06-01T07:18:12+08:00

Eu descobri como gerenciar isso no meu caso, muito deve ser o mesmo para qualquer outra pessoa, você deve poder adaptar esse processo para trabalhar com qualquer URL.

Mude para um novo diretório
Primeiro devemos mudar para um novo diretório para evitar que os arquivos se percam ou sejam mantidos depois que precisarmos deles.
mkdir ~/Desktop/dev
cd ~/Desktop/dev
Obter URLs comwget
Next usamos o wgetcomando para encontrar todas as URLs para arquivos e pastas no domínio, para mim o comando foi:
wget -o ./urls.txt --spider -r --reject="index.html" --no-verbose --no-parent https://downloads.tuxfamily.org/godotengine/
Basta substituir a URL no comando acima e ele deve criar um arquivo de texto ( urls.txt) cheio de URLs e um monte de outras bobagens.
Remover pasta deixada porwget
wget terá deixado para trás uma pasta chamada qualquer que seja o domínio do seu URL de entrada. Não há informações importantes nesta pasta, então vá em frente e remova-a com o rmcomando ou através do seu gerenciador de arquivos.
Construir um regex para extrair as URLs reais
Essa é a parte difícil, recomendo abrir urls.txtem uma edição de texto ou que permita encontrar com regexs e abrir regex no seu navegador, agora você tem que construir um . Depois de encontrar uma regex que corresponda às URLs, execute o comando:
grep -o -E "(https.*\/([0-9](\.[0-9])+)\/(mono\/)?Godot_v\2[-_]stable[_-](mono_)?((win)?(x11[\._])?(osx\.?)?)((32)?(64)?)?((\.exe)?(\.fat)?)\.zip)" ./urls.txt >> urls\ filtered.txt
Isso copiará todas as linhas correspondentes à regex para um arquivo de texto ( urls filtered.txt). Substitua a regex (o bit entre aspas) por sua regex.

Depois de tudo isso, você deve ficar com um arquivo de texto de todas as URLs necessárias.

ecoar todos os URLs correspondentes a regex

Existe um comando para listar todos os usuários? Também para adicionar, excluir, modificar usuários, no terminal?

Como excluir um diretório não vazio no Terminal?

Como descompactar um arquivo zip do Terminal?

Como instalo um arquivo .deb por meio da linha de comando?

Como instalo um arquivo .tar.gz (ou .tar.bz2)?

Como listar todos os pacotes instalados

ecoar todos os URLs correspondentes a regex

1 respostas

relate perguntas

Existe um comando para listar todos os usuários? Também para adicionar, excluir, modificar usuários, no terminal?

Como excluir um diretório não vazio no Terminal?

Como descompactar um arquivo zip do Terminal?

Como instalo um arquivo .deb por meio da linha de comando?

Como instalo um arquivo .tar.gz (ou .tar.bz2)?

Como listar todos os pacotes instalados