Quais são as principais causas de deadlocks e podem ser evitadas?

Question

RLH

Asked: 2011-09-03 05:41:49 +0800 CST2011-09-03 05:41:49 +0800 CST 2011-09-03 05:41:49 +0800 CST

Por que ainda existe um tipo de dados varchar?

772

Muitos dos meus bancos de dados têm campos definidos como varchars. Isso não tem sido um grande problema desde que moro e trabalho na América (onde a única língua que existe é "americano". ahem )

Depois de trabalhar com bancos de dados por cerca de 5 anos, descobri que eventualmente tive problemas com a natureza limitada do campo varchar e tive que modificar meus campos para armazenar dados como nvarchars. Depois de fazer outra atualização em uma tabela, convertendo um campo varchar em um nvarchar, pensei-- por que ainda estamos fazendo dessa maneira? Há muito tempo tomei a decisão mental de definir todos os meus novos campos de texto para nvarchar, em vez de varchar, que é o que aprendi a fazer em meus livros didáticos quando estava na escola, 10 anos atrás.

É 2011 e houve uma nova versão do SQL Server no ano passado. Por que continuamos a oferecer suporte a um tipo de dados varchar quando podemos/devemos usar nvarchar?

Eu sei que muitas vezes é argumentado que nvarchars são "duas vezes maiores" que varchars, então o uso do espaço de armazenamento pode ser um argumento para manter varcars.

No entanto, os usuários de hoje podem definir seus nvarchars para armazenar os dados como UTF-8 em vez do padrão UTF-16 se quiserem economizar espaço de armazenamento. Isso permitiria a codificação de 8 bits, se isso for principalmente desejável, ao mesmo tempo em que garante que o raro caractere de 2 a 8 bytes que é inserido em seu banco de dados não quebraria nada.

Estou esquecendo de algo? Existe uma boa razão para isso não ter mudado nos últimos 15-20 anos?

5 respostas

Voted

gbn · Answer 1 · 2011-09-03T07:03:19+08:00

Best Answer

gbn

2011-09-03T07:03:19+08:002011-09-03T07:03:19+08:00

O trabalho varchar é bom o suficiente para muitos idiomas da Europa Ocidental (norueguês, dinamarquês, alemão, francês, holandês, etc.) sujeito a alguns problemas de agrupamento
Veja isso em SO varchar vs desempenho nvarchar nvarchar tem sérias implicações de desempenho
Isso é trivial comparado a lidar com datas MDY vs DMY

37

Derek Kromm · Answer 2 · 2011-09-03T10:47:31+08:00

Derek Kromm

2011-09-03T10:47:31+08:002011-09-03T10:47:31+08:00

Além das respostas abordando padrões e compatibilidade, deve-se também ter em mente o desempenho. Embora o espaço em disco seja prontamente aceito como barato, os DBAs/desenvolvedores geralmente ignoram o fato de que o desempenho da consulta às vezes está diretamente relacionado ao tamanho da linha/página de uma tabela. Usar NVARCHARem vez de VARCHAR(quando desnecessário) dobrará efetivamente o tamanho da linha para seus campos de caracteres. Se você tiver, digamos, 5 ou 10 campos de 50 comprimentos, está falando sobre a possibilidade de adicionar 500 bytes adicionais por linha. Se você tiver uma tabela grande, isso pode colocar cada linha em várias páginas e ter um efeito adverso no desempenho.

23

nvogel · Answer 3 · 2011-09-03T06:43:29+08:00

nvogel

2011-09-03T06:43:29+08:002011-09-03T06:43:29+08:00

Muitas organizações ainda possuem uma grande base instalada de aplicativos, interfaces, plataformas e ferramentas que assumem caracteres de byte único. Os bancos de dados raramente vivem isolados - eles são parte de um ecossistema de TI. Se você tiver milhares de componentes e milhões de linhas de código dependentes de caracteres de byte único, precisará de um bom motivo para investir o tempo e o dinheiro necessários para mudar para unicode. Mudanças nessa escala podem levar anos para serem concluídas. Em alguns lugares, o Unicode ainda é relativamente novo, raro ou sem suporte total.

VARCHAR e NVARCHAR fazem parte do SQL padrão ISO. Remover ou depreciar o suporte VARCHAR no SQL Server seria um retrocesso em compatibilidade e portabilidade.

17

dan04 · Answer 4 · 2011-09-03T16:57:05+08:00

dan04

2011-09-03T16:57:05+08:002011-09-03T16:57:05+08:00

Como alternativa, os usuários de hoje podem definir seus nvarchars para armazenar os dados como UTF-8 em vez do padrão UTF-16 se quiserem economizar espaço de armazenamento.

Isso é exatamente o que a maioria dos bancos de dados de código aberto faz com VARCHAR.

O MySQL fornece utf8e ucs2"agrupamentos".
O SQLite oferece uma escolha entre UTF-8 (o padrão) e UTF-16.
PostgreSQL suporta UTF-8 (mas não UTF-16).

Não há necessidade de ter dois tipos de string separados.

A Microsoft é estranha com sua visão de que strings de 8 bits são para codificações herdadas e Unicode = UTF-16. O que provavelmente está relacionado à própria API do Windows tratando chare wchar_tdessa forma.

16

Jason · Answer 5 · 2011-09-03T07:04:01+08:00

Jason

2011-09-03T07:04:01+08:002011-09-03T07:04:01+08:00

Porque alguns de nós construímos aplicativos menores e mais leves em hardware menos avançado que não precisa de recursos Unicode. Talvez precisemos alterá-lo mais tarde, mas, por enquanto, simplesmente não precisamos disso. Eu gosto de minhas strings ocupando 1/2 do espaço que de outra forma teriam sob NVARCHAR.

15

Por que ainda existe um tipo de dados varchar?

Como você mysqldump tabela (s) específica (s)?

Como você mostra o SQL em execução em um banco de dados Oracle?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

Como uso currval() no PostgreSQL para obter o último id inserido?

Como executar o psql no Mac OS X?

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Passando parâmetros de array para um procedimento armazenado

Por que ainda existe um tipo de dados varchar?

5 respostas

relate perguntas