Desejo solicitar ao usuário que insira uma URL, mas ela só pode conter A-Z
, a-z
, 0-9
, &
, .
, /
, =
, _
, -
, :
e ?
.
Assim, por exemplo:
Enter URL:
$ http://youtube.com/watch?v=1234df_AQ-x
That URL is allowed.
Enter URL:
$ https://unix.stackexchange.com/$FAKEurl%?123
That URL is NOT allowed.
Isto é o que eu inventei até agora, mas não parece funcionar corretamente:
if [[ ! "${URL}" == *[abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890\-\_\/\&\?\:\.\=]* ]]; then
echo "That URL is NOT allowed."
else
echo "That URL is allowed."
fi
Observe que os URLs que forneci no exemplo são apenas exemplos. Esse script precisa funcionar com todas as entradas possíveis do usuário; ele simplesmente não pode conter caracteres diferentes dos especificados anteriormente.
Usando bash 3.2.57(1)-release no macOS High Sierra 10.13.6.
Você estava perto.
Você deseja verificar se o URL contém pelo menos um dos caracteres não permitidos (e, em seguida, denunciá-lo como inválido), não pelo menos um dos caracteres permitidos.
Você pode negar um conjunto de caracteres em uma expressão de colchetes com
!
(^
também funciona combash
e alguns outros shells).De qualquer forma, você estava certo em listar explicitamente os caracteres individualmente, usando intervalos como
a-z
,A-Z
,0-9
só funcionaria (ao corresponder apenas aos 26+26+10 caracteres listados) na localidade C. Em outras localidades, eles podem corresponder a milhares de outros caracteres ou até mesmo agrupar elementos feitos de mais de um caractere (os que classificam entreA
eZ
gostamÉ
, por exemplo, deA-Z
).Sua tentativa
Sua tentativa pode não funcionar conforme o esperado porque considera todos os URLs permitidos que contenham pelo menos um dos caracteres permitidos. Formalmente, você compara o URL com
Se isso não corresponder, você rejeita o URL.
Isso pode ajudar
Se você substituir o seu
if ... else ... fi
porpode fazer o que você quer.
Aqui, o operador binário
=~
é usado para encontrar uma correspondência da expressão regular[^A-Za-z0-9\&\./=_-:\?]
dentro de"${URL}"
. Este operador não requer que a string inteira"${URL}"
corresponda à expressão regular, qualquer substring correspondente servirá. Essa correspondência é encontrada para qualquer caractere que não seja permitido na URL. O "não" vem do acento circunflexo (^
) na definição do conjunto de caracteres. Observe que não há mais negação!
na expressão condicional.Se
"${URL}"
contiver um caractere proibido, a expressão regular corresponde e o comando composto[[...]]
é avaliado como verdadeiro (status de saída zero).Sua lógica atual está errada, ela retorna true somente quando cada caractere na URL de entrada existe fora do conjunto de caracteres permitidos.
Tente algo ao longo das linhas de
Esta verificação, devido à negação (!) dentro do intervalo de caracteres, tem como objetivo retornar true quando a URL de entrada contém um ou mais caracteres fora do conjunto permitido
Solução compacta
Se você preferir uma solução compacta, você pode usar esta:
Explicação
Esta solução usa uma expansão de parâmetro do formulário
${<variable>//<pattern>}
que é um caso especial da forma mais geralIsso é expandido pelo shell para o valor de
<variable>
, onde todas as correspondências de<pattern>
são substituídas por<replace>
. No nosso caso,<replace>
está vazio, o que também permite omitir a barra após<pattern>
.Como resultado,
"${URL//[A-Za-z0-9\&.\/=_:?-]}"
é expandido para o URL com todos os caracteres permitidos removidos. Se não houver resíduos, ou seja, a URL é permitida,[ ... ]
na verdade é[ ]
, o que gera false (status de saída 0). Se houver caracteres restantes, eles são proibidos e[ ... ]
têm o formato[ <nes> ]
, onde<nes>
é uma string não vazia, que produz true (status de saída 1).O comando geral é uma lista de três comandos separados pelos operadores de controle
&&
(and) e||
(or), que são associativos à esquerda. Portanto, a sublistaé avaliado primeiro. Lá, o segundo operando de
&&
é avaliado se e somente se o primeiro for avaliado como verdadeiro (status de saída zero). Este é o caso se o URL contiver caracteres proibidos. Então, oecho
dá a resposta certa neste caso, "Não", e o status de saída dessa sublista vem desteecho
comando: 0 (verdadeiro).Se, ao contrário, a URL for permitida, o status de saída dessa sublista vem de
[ ... ]
: 1 (falso).Agora o resto da lista:
O
||
operador executa o último comando se e somente se seu primeiro operando for falso (status de saída diferente de zero). Assim, obtemos o "Sim" somente se<sub-list>
for falso, ou seja, para uma URL permitida, como deveria ser.Se estrutura
Claro que você pode usar o
[ ... ]
comando acima também em umaif
estrutura. Na maioria dos casos, isso resultará em um código mais legível: