Existem ferramentas de benchmarking do MySQL? [fechado]

Question

Dinesh Kumar

Asked: 2018-09-13 22:56:23 +0800 CST2018-09-13 22:56:23 +0800 CST 2018-09-13 22:56:23 +0800 CST

utf8_bin e utf8_general_cs são iguais?

772

Aqui está a situação:

Eu encontrei vários posts para " utf8_bin vs utf8_general_ci ".
Da mesma forma, " utf8_general_cs vs utf8_general_ci ".

Mas não consigo encontrar um post para " utf8_bin vs utf8_general_cs ". Então, eles são iguais? Se não, qual a diferença entre eles?

Nota: verifiquei que utf8_general_cs não está disponível no MySQL padrão. Posso saber porquê?

1 respostas

Voted

Solomon Rutzky · Answer 1 · 2018-09-14T05:28:56+08:00

A noção de que os agrupamentos binários são os mesmos que diferenciam maiúsculas de minúsculas é, infelizmente, extremamente comum.

No entanto, eles não são funcionalmente equivalentes. Existem quatro áreas onde as diferenças comportamentais podem ser vistas (pelo menos quatro que eu conheço):

Combinando Personagens

Considere ter uma minúscula ü("u" com trema) e uma maiúscula Ü("U" com trema). Ambos os tipos de agrupamentos serão capazes de distingui-los.

Agora, considere ter uma maiúscula U e um ̈(combinando trema). Quando o caractere de combinação é colocado após o não acentuado U, você obtém Ü. Visualmente é o mesmo que o single Ü("U" com trema). E um agrupamento que diferencia maiúsculas de minúsculas (e até mesmo acentos) parecerá o mesmo, mesmo que um seja um único ponto de código e o outro seja uma combinação de dois pontos de código. Mas um agrupamento binário não pode compará-los como sendo iguais, pois não são os mesmos pontos de código (ou mesmo o mesmo número de pontos de código).
Caracteres de largura total

Um agrupamento que faz distinção entre maiúsculas e minúsculas, mas não diferencia largura, seria capaz de igualar =ｏ=e =o=. No entanto, um agrupamento binário não pode parecer igual, pois são pontos de código diferentes.
Insensibilidade de sotaque

Um agrupamento que diferencia maiúsculas de minúsculas, mas não diferencia acentos, seria capaz de igualar oe ô. No entanto, um agrupamento binário não pode parecer igual, pois são pontos de código diferentes.
Ordenação

Um agrupamento que diferencia maiúsculas de minúsculas será classificado ~antes ae Adepois dele. Mas, um agrupamento binário classificará esses mesmos caracteres como: Athen athen ~.

Tudo isso está documentado no seguinte post meu:

Não, os agrupamentos binários não diferenciam maiúsculas de minúsculas

Ele é apresentado em termos de Microsoft SQL Server, mas o comportamento é baseado em regras definidas pelo padrão Unicode, que deve ser o mesmo em RDBMSs, idiomas, SOs, etc (com pequena variação devido a qual versão do padrão Unicode está sendo usado e quem fez a implementação, já que o Unicode é apenas um padrão e foi implementado com pequenas variações entre os fornecedores).

Verifiquei que utf8_general_cs não está disponível no MySQL padrão. Posso saber porquê?

Meu palpite é que os agrupamentos "gerais" são obsoletos e foram substituídos por agrupamentos "unicode" e específicos de cultura mais recentes. A documentação (no meio da página, parágrafo começando com " Para qualquer conjunto de caracteres Unicode "), afirma ainda:

utf8_general_cié um agrupamento herdado que não oferece suporte a expansões, contrações ou caracteres ignoráveis. Ele pode fazer apenas comparações um-para-um entre os caracteres.

Os agrupamentos "unicode" provavelmente são os pesos de classificação e as regras de agrupamento padrão. Os agrupamentos específicos da cultura adaptam os pesos e as regras para serem corretos para essa cultura (quando o padrão estiver incorreto). Para obter mais informações sobre por que existem diferentes agrupamentos, consulte minha resposta à seguinte pergunta SO:

Qual é o objetivo de COLLATIONS para colunas nvarchar (Unicode)?

utf8_bin e utf8_general_cs são iguais?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

utf8_bin e utf8_general_cs são iguais?

1 respostas

relate perguntas