Eu tenho uma tabela que armazena os caminhos do sistema Windows. Estou coçando a cabeça sobre como armazená-los e, em particular, qual agrupamento usar.
Os caminhos são strings unicode. Eles não diferenciam maiúsculas de minúsculas, portanto, os agrupamentos 'utf8_bin is probably not the best thing to do. However all the
utf8_*_ci` permitem igualdade entre strings correspondentes a caminhos diferentes.
Estou ciente de que a comparação de caminhos geralmente é muito mais envolvida que a comparação de strings, devido à presença potencial de ..
diretórios pai ( ), links simbólicos, nomenclatura alternativa 8.3, também. Estou assumindo que as pastas são inseridas de maneira sistematicamente consistente.
O que as pessoas fazem ao armazenar caminhos? Eles supõem que as pastas são sempre armazenadas de maneira consistente e dizem que sempre armazenam os caminhos do Windows em letras minúsculas ou maiúsculas e usam utf8_general
? Ou outro agrupamento? Ou simplesmente esquecer a ideia de usar a comparação de caminho do lado do servidor?
Não até o MySQL 8.0 existe um agrupamento "insensível a maiúsculas e minúsculas, sensível a acentos":