Estou baixando uma lista de arquivos de urls que contêm informações adicionais além dos nomes dos arquivos com wget. Isso resulta em nomes de arquivos como:
pythonbook.pdf@y=11&x=123
Tudo o que eu realmente quero é a parte pythonbook.pdf. Minha lista de arquivos é basicamente uma lista de URLs como:
https://dl.domain.com/pythonbook.pdf@y=11&x=123
Como posso não ter a parte desnecessária do nome do arquivo?
Provavelmente é mais fácil iterar em toda a lista neste caso (já
wget
que não parece ter suporte para a criação dinâmica de nomes de arquivos de saída):url
é a URL lida da lista de URLs no arquivo,pdf
é apenas a parte do nome do arquivo.Caso os nomes não sejam exclusivos, você pode adicionar um número ao nome do arquivo, por exemplo, assim (supondo que todos os arquivos sejam PDFs):
ou (se os arquivos tiverem sufixos diferentes)