Eu tenho um esquema em um MySQL versão 8 e devo migrá-lo para um MariaDB versão 10.3. (com Mysqldump)
O esquema tem Charset = utf8mb4
ecollation = utf8mb4_general_ci
O servidor MariaDB tem padrão Charset = utf8
ecollation = utf8_general_ci
Quando tento importar o dump é impossível por causa do erro:
Unknown collation: utf8mb4_general_ci
Encontrei uma solução aqui: https://stackoverflow.com/questions/42385099/1273-unknown-collation-utf8mb4-unicode-520-ci
E funcionou. Mas eu quero saber:
Primeiro: essas diferenças podem causar perda de dados após a importação de dados dmp?
Segundo: essas diferenças podem causar alguma diferença na saída ou classificação no meu novo servidor?
- Eu tenho alguns outros esquemas no servidor MariaDB e não posso (e não quero!)
Primeiro, não recomendo voltar duas décadas para Charset = utf8 e collation = utf8_general_ci
utf8
perderá todos os seus Emoji e alguns caracteres chineses. Além disso, muitas coisas serão comparadas de maneira diferente.Em vez disso, vá para o "melhor disponível" no MariaDB ...
Você tem um problema, mas o título da sua pergunta não é a pergunta certa.
Isso ocorre porque o MySQL implementou alguns
COLLATIONs
que o MariaDB ainda não implementou.Ambos os bancos de dados tratam do conjunto de caracteres
utf8mb4
. Portanto, a codificação não é o problema.O agrupamento pode ser um pequeno problema ou um grande problema.
utf8mb4_unicode_520
. Não é idêntico autf8mb4_general_ci
, mas é próximo.PRIMARY KEY
ouUNIQUE
. Pode aparecer como "chave duplicada".Suas perguntas --
Perda de dados - Não (assumindo utf8mb4), a menos que você obtenha uma chave duplicada, e isso leva à falha na inserção de uma linha.
Diferenças na saída -- (novamente, improvável) -- Vários acentos e caracteres especiais podem ser comparados de forma diferente devido à alteração no Collation.
Meu gráfico não mostra diferenças de agrupamento entre 520 e 0900, mas o gráfico cobre apenas um pequeno subconjunto de caracteres UTF-8. (Há muitas diferenças com utf8_general_ci.)
Não. MariaDB 10.3 suporta UTF8MB4.
Sim. A comparação e a classificação são realizadas de acordo com COLLATION. Portanto, a comparação pode produzir outro resultado e, portanto, outra saída, a classificação pode produzir outra ordenação de linhas.