Qual é a diferença entre os tipos de dados MySQL VARCHAR e TEXT?

Question

Tom Marthenal

Asked: 2013-03-18 10:43:40 +0800 CST2013-03-18 10:43:40 +0800 CST 2013-03-18 10:43:40 +0800 CST

Ordenando registros arbitrariamente em uma tabela

772

Uma necessidade comum ao usar um banco de dados é acessar os registros em ordem. Por exemplo, se eu tiver um blog, quero poder reordenar minhas postagens em ordem arbitrária. Essas entradas geralmente têm muitos relacionamentos, portanto, um banco de dados relacional parece fazer sentido.

A solução comum que vi é adicionar uma coluna inteira order:

CREATE TABLE AS your_table (id, title, sort_order)
AS VALUES
  (0, 'Lorem ipsum',   3),
  (1, 'Dolor sit',     2),
  (2, 'Amet, consect', 0),
  (3, 'Elit fusce',    1);

Em seguida, podemos classificar as linhas orderpara colocá-las na ordem correta.

No entanto, isso parece desajeitado:

Se eu quiser mover o registro 0 para o início, tenho que reordenar todos os registros
Se eu quiser inserir um novo registro no meio, tenho que reordenar todos os registros depois dele
Se eu quiser remover um registro, tenho que reordenar todos os registros depois dele

É fácil imaginar situações como:

Dois registros têm o mesmoorder
Existem lacunas orderentre os registros

Isso pode acontecer facilmente por vários motivos.

Esta é a abordagem adotada por aplicativos como o Joomla:

Exemplo da abordagem do Joomla para ordenação

Você poderia argumentar que a interface aqui é ruim e que, em vez de humanos editarem números diretamente, eles deveriam usar setas ou arrastar e soltar - e provavelmente você estaria certo. Mas nos bastidores, a mesma coisa está acontecendo.

Algumas pessoas propuseram o uso de um decimal para armazenar a ordem, para que você possa usar "2,5" para inserir um registro entre os registros nas ordens 2 e 3. E embora isso ajude um pouco, é sem dúvida ainda mais confuso porque você pode acabar com decimais estranhos (onde você para? 2,75? 2,875? 2,8125?)

Existe uma maneira melhor de armazenar pedidos em uma tabela?

6 respostas

Voted

Mike Sherrill 'Cat Recall' · Answer 1 · 2013-03-18T12:24:52+08:00

Se eu quiser mover o registro 0 para o início, tenho que reordenar todos os registros

Não, há uma maneira mais simples.

update your_table
set order = -1 
where id = 0;

Se eu quiser inserir um novo registro no meio, tenho que reordenar todos os registros depois dele

Isso é verdade, a menos que você use um tipo de dados que suporte valores "entre". Os tipos flutuante e numérico permitem que você atualize um valor para, digamos, 2,5. Mas varchar(n) também funciona. (Pense 'a', 'b', 'c'; então pense 'ba', 'bb', 'bc'.)

Se eu quiser remover um registro, tenho que reordenar todos os registros depois dele

Não, há uma maneira mais simples. Basta excluir a linha. As linhas restantes ainda serão classificadas corretamente.

É fácil imaginar situações como:

Dois registros têm a mesma ordem

Uma restrição exclusiva pode impedir isso.

Existem lacunas na ordem entre os registros

As lacunas não têm efeito sobre como um dbms classifica os valores em uma coluna.

Algumas pessoas propuseram o uso de um decimal para armazenar a ordem, para que você possa usar "2,5" para inserir um registro entre os registros nas ordens 2 e 3. E embora isso ajude um pouco, é sem dúvida ainda mais confuso porque você pode acabar com decimais estranhos (onde você para? 2,75? 2,875? 2,8125?)

Você não para até que seja necessário . O dbms não tem problemas em classificar valores que tenham 2, 7 ou 15 casas após o ponto decimal.

Acho que seu problema real é que você gostaria de ver os valores na ordem de classificação como números inteiros. Você pode fazer isso.

create table your_table (
  id int primary key, 
  title varchar(13), 
  sort_order float
);
    
insert into your_table values
(0, 'Lorem ipsum', 2.0),
(1, 'Dolor sit', 1.5),
(2, 'Amet, consect', 0.0),
(3, 'Elit fusce', 1.0);

-- This windowing function will "transform" the floats into sorted integers.
select id, title,
       row_number() over (order by sort_order)
from your_table

user2382679 · Answer 2 · 2014-08-22T09:29:57+08:00

user2382679

2014-08-22T09:29:57+08:002014-08-22T09:29:57+08:00

É muito simples. Você precisa ter uma estrutura de "buraco de cardinalidade":

Você precisa ter 2 colunas:

pk = 32 bitsinteger
ordem = 64 bits bigint( não double )

Inserir/atualizar

Ao inserir o primeiro novo registro, defina order = round(max_bigint / 2).
Ao inserir no início da tabela, definaorder = round("order of first record" / 2)
Ao inserir no final da mesa, coloque order = round("max_bigint - order of last record" / 2) 4) Ao inserir no meio, coloqueorder = round("order of record before - order of record after" / 2)

Este método tem uma cardinalidade muito grande. Se você tiver um erro de restrição ou se achar que tem cardinalidade pequena, poderá reconstruir a coluna de ordem (normalizar).

Em situação máxima com normalização (com esta estrutura), você pode ter "buraco de cardinalidade" em 32 bits.

Lembre-se de não usar tipos de ponto flutuante - a ordem deve ser um valor preciso!

9

igelkott · Answer 3 · 2013-03-18T12:25:40+08:00

igelkott

2013-03-18T12:25:40+08:002013-03-18T12:25:40+08:00

Geralmente, a ordenação é feita de acordo com alguma informação do prontuário, título, RG ou o que for adequado para aquela situação específica.

Se você precisar de uma ordem especial, usar uma coluna inteira não é tão ruim quanto parece. Por exemplo, para abrir espaço para um recorde chegar ao 5º lugar, você pode fazer algo como:

update table_1 set place = place + 1 where place > 5.

Espero que você possa declarar que a coluna é uniquee talvez tenha um procedimento para fazer rearranjos "atômicos". Os detalhes dependem do sistema, mas essa é a ideia geral.

5

Greenstone Walker · Answer 4 · 2013-03-18T13:12:50+08:00

Greenstone Walker

2013-03-18T13:12:50+08:002013-03-18T13:12:50+08:00

…é indiscutivelmente ainda mais confuso porque você pode acabar com decimais estranhos (onde você para? 2,75? 2,875? 2,8125?)

Quem se importa? Esses números estão lá apenas para o computador lidar, então não importa quantos dígitos fracionários eles tenham ou quão feios eles pareçam para nós.

Usar valores decimais significa que, para mover o item F entre os itens J e K, tudo o que você precisa fazer é selecionar os valores de ordem para J e K, calcular a média deles e atualizar F. Duas instruções SELECT e uma instrução UPDATE (provavelmente feito usando isolamento serializável para evitar impasses).

Se você quiser ver inteiros em vez de frações na saída, calcule inteiros no aplicativo cliente ou use as funções ROW_NUMBER() ou RANK() (se seu RDBMS os incluir).

4

Vedant Agarwala · Answer 5 · 2019-08-08T22:45:41+08:00

Achei essa resposta muito melhor. Citando-o inteiramente:

Os bancos de dados são otimizados para certas coisas. Atualizar muitas linhas rapidamente é uma delas. Isso se torna especialmente verdadeiro quando você permite que o banco de dados faça seu trabalho.

Considerar:
order song
1     Happy Birthday
2     Beat It
3     Never Gonna Give You Up
4     Safety Dance
5     Imperial March
E você quer ir Beat Itpara o final, você teria duas consultas:
update table 
  set order = order - 1
  where order >= 2 and order <= 5;

update table
  set order = 5
  where song = 'Beat It'
E é isso. Isso aumenta muito bem com números muito grandes. Tente colocar alguns milhares de músicas em uma lista de reprodução hipotética em seu banco de dados e veja quanto tempo leva para mover uma música de um local para outro. Como estes têm formas muito padronizadas:
update table 
  set order = order - 1
  where order >= ? and order <= ?;

update table
  set order = ?
  where song = ?
Você tem duas instruções preparadas que podem ser reutilizadas com muita eficiência.

Isso oferece algumas vantagens significativas - a ordem da tabela é algo sobre o qual você pode raciocinar. A terceira música tem um orderde 3, sempre. A única maneira de garantir isso é usar números inteiros consecutivos como ordem. Usar listas pseudoligadas ou números decimais ou inteiros com lacunas não permitirá que você garanta essa propriedade; nesses casos, a única maneira de obter a enésima música é classificar a tabela inteira e obter o enésimo registro.

E realmente, isso é muito mais fácil do que você pensa. É simples descobrir o que você quer fazer, gerar as duas instruções de atualização e outras pessoas olharem para essas duas instruções de atualização e perceberem o que está sendo feito.

tjb1982 · Answer 6 · 2019-06-17T16:27:07+08:00

Em meu próprio projeto, estou planejando tentar uma solução semelhante à solução de número decimal, mas usando matrizes de bytes:

def pad(x, x_len, length):
    if x_len >= length:
        return x
    else:
        for _ in range(length - x_len):
            x += b"\x00"
        return x

def order_index(_from, _to, count, length=None):
    assert _from != _to
    assert _from < _to

    if not length:
        from_len = len(_from)
        to_len = len(_to)
        length = max(from_len, to_len)

        _from = pad(_from, from_len, length)
        _to = pad(_to, to_len, length)

    from_int = int.from_bytes(_from, "big")
    to_int = int.from_bytes(_to, "big")
    inc = (to_int - from_int)//(count + 1)
    if not inc:
        length += 1
        _from += b"\x00"
        _to += b"\x00"
        return order_index(_from, _to, count, length)

    return (int.to_bytes(from_int + ((x+1)*inc), length, "big") for x in range(count))

>>> index = order_index(b"A", b"Z", 24)
>>> [x for x in index]
[b'B', b'C', b'D', b'E', b'F', b'G', b'H', b'I', b'J', b'K', b'L', b'M', b'N', b'O', b'P', b'Q', b'R', b'S', b'T', b'U', b'V', b'W', b'X', b'Y']
>>> 
>>> index = order_index(b"A", b"Z", 25)
>>> [x for x in index]
[b'A\xf6', b'B\xec', b'C\xe2', b'D\xd8', b'E\xce', b'F\xc4', b'G\xba', b'H\xb0', b'I\xa6', b'J\x9c', b'K\x92', b'L\x88', b'M~', b'Nt', b'Oj', b'P`', b'QV', b'RL', b'SB', b'T8', b'U.', b'V$', b'W\x1a', b'X\x10', b'Y\x06']

A ideia é que você nunca pode ficar sem valores intermediários possíveis porque você apenas acrescenta um b"\x00"aos registros envolvidos se precisar de mais valores. ( inté ilimitado no Python 3, caso contrário, você teria que escolher uma fatia dos bytes no final para comparar, assumindo que, entre dois valores adjacentes, as diferenças seriam compactadas no final.)

Por exemplo, digamos que você tenha dois registros, b"\x00"e b"\x01", e deseja que um registro fique entre eles. Não há valores disponíveis entre 0x00e 0x01, então você acrescenta b"\x00"a ambos e agora tem vários valores entre eles que pode usar para inserir novos valores.

>>> records = [b"\x00", b"\x01", b"\x02"]
>>> values = [x for x in order_index(records[0], records[1], 3)]
>>> records = records + values
>>> records.sort()
>>> records
[b'\x00', b'\x00@', b'\x00\x80', b'\x00\xc0', b'\x01', b'\x02']

O banco de dados pode classificá-lo facilmente porque tudo acaba em ordem lexicográfica. Se você excluir um registro, ele ainda estará em ordem. No meu projeto, fiz b"\x00"e b"\xff"como FIRSTe LASTregistros, no entanto, para usá-los como valores virtuais "de" e "para" para preceder/acrescentar novos registros:

>>> records = []
>>> value = next(order_index(FIRST, LAST, 1))
>>> value
b'\x7f'
>>> records.append(value)
>>> value = next(order_index(records[0], LAST, 1))
>>> value
b'\xbf'
>>> records.append(value)
>>> records.sort()
>>> records
[b'\x7f', b'\xbf']
>>> value = next(order_index(FIRST, records[0], 1))
>>> value
b'?'
>>> records.append(value)
>>> records.sort()
>>> records
[b'?', b'\x7f', b'\xbf']

Ordenando registros arbitrariamente em uma tabela

Inserir/atualizar

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Conceder acesso a todas as tabelas para um usuário

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Ordenando registros arbitrariamente em uma tabela

6 respostas

Inserir/atualizar

relate perguntas