AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 343093
Accepted
hz lin
hz lin
Asked: 2024-10-19 23:18:00 +0800 CST2024-10-19 23:18:00 +0800 CST 2024-10-19 23:18:00 +0800 CST

É possível compactar ou particionar uma tabela enorme existente no local para o mariadb?

  • 772

Tenho um banco de dados mariadb configurado para registrar dados de experimentos. Em uma das tabelas, armazeno imagens brutas enormes em cada linha. Com alguns milhões de linhas, cada uma contendo 3 imagens de 512*512px, fico sem espaço em disco. Tenho 12 TB de disco e o banco de dados consumiu ~10 TB. A diferença entre as imagens é pequena, então acredito que há muito espaço para compactação. Quero considerar a compactação do banco de dados, mas com espaço livre limitado, quero um método para compactá-lo no lugar. Uso o mariadb 10.3.39 no Ubuntu 20.04. Não sou especialista em banco de dados, mas ficarei feliz em aprender mais. Eu tentei:

ALTER TABLE images ROW_FORMAT=COMPRESSED KEY_BLOCK_SIZE=8 ALGORITHM=INPLACE;

e eu obtive:

ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MariaDB server version for the right syntax to use near 'ALGORITHM=INPLACE' at line 1 

Também considerei que talvez eu possa particionar minha tabela em pedaços e compactar cada partição individualmente. No entanto, também não tenho certeza se particionar uma tabela existente requer mais espaço. Gostaria de obter alguma recomendação antes de tentar às cegas.

mariadb
  • 2 2 respostas
  • 21 Views

2 respostas

  • Voted
  1. Best Answer
    Rick James
    2024-10-19T23:30:27+08:002024-10-19T23:30:27+08:00

    Resposta curta: Não

    Resposta longa:

    • Que tipo de imagens são? A maioria dos formatos (.jpg, etc) já são compactados, então a compactação não tem benefício algum.
    • O COMPRESSED do InnoDB fornece apenas uma compressão de 2:1, mesmo nas melhores situações (números e strings, não imagens). OTOH, a compressão é automática, então não há necessidade de comprimir algumas partes e não outras.
    • Qual é a maior tabela? Quão grande ela é? Muitos tipos de alterações em uma tabela exigem a cópia da tabela. Ou seja, durante a operação, você precisa de espaço para uma cópia da tabela. Especificamente, INPLACEnão vai funcionar.
    • O MariaDB não tem uma maneira de calcular a diferença entre duas imagens. É disso que você precisa. Mesmo se você encontrar algo assim, há muita programação para implementá-lo.
    • Inicialmente, PARTITIONseus 10 GB seriam necessários 10 GB extras (que você não tem).
    • Muito poucas operações podem ser executadas em um único PARTITION; isso elimina seu benefício hipotético de particionamento.

    Aqui vai uma ideia...

    1. Experimente com BLOBs de amostra (512 MB cada?). Faça isso no seu aplicativo, não no MariaDB.
    2. Se você notar uma redução significativa, prossiga.
    3. Percorra a tabela por meio de seu PRIMARY KEY. Leia o(s) blob(s), compacte-os e armazene-os de volta na tabela. Isso levará muito tempo e, aparentemente, não economizará espaço em disco. (Mais sobre isso depois.)
    4. Enquanto isso, altere o código do aplicativo de duas maneiras: (1) monitore o andamento da compactação, para que ele saiba se deve descompactar durante a leitura. (2) Ou observe os primeiros bytes para ver se o blob está compactado (e descompacte, se necessário).
    5. Quando terminar, a tabela ainda terá 10 GB, mas terá muitos buracos. A maioria deles deve ser reutilizada no futuro INSERTs. Advertência: A coluna BLOB provavelmente está armazenada "off-record"; não sei se os blocos liberados podem ser reutilizados. Então, recomendo executar alguns testes.
    6. Eventualmente, os buracos serão usados, e as novas fileiras farão a mesa crescer.

    Ou...

    Se você consegue conviver com linhas "antigas" sendo excluídas, veja aqui como fazer isso com o mínimo de impacto: https://mysql.rjweb.org/doc.php/deletebig

    • 0
  2. nbk
    2024-10-20T02:27:51+08:002024-10-20T02:27:51+08:00

    Basicamente, uma boa imagem compactada, mesmo que seja impecável, será melhor do que uma linha compactada.

    mas como MARIAFB não suporta compressão em um ALTER TABLE

    O que você pode fazer é

    CREATE tABLE tmp1(Images blob)
    
    INSERT INTO tmp1 VALUES(RPAD('', 65535, CHAR(7)));
    
    CREATE TABLE cmp2 (i Blob COMPRESSED=zlib)
    SELECT images FROM tmp1
    
    Records: 1  Duplicates: 0  Warnings: 0
    

    violino

    • 0

relate perguntas

  • Erro de cabeçalho do MariaDB

  • Erro 1046 Mariadb: nenhum banco de dados selecionado

  • Você ainda usa o MyISAM ou prefere o mecanismo de armazenamento Aria?

  • Como posso melhorar minha instrução SQL com resultados semanais com semana começando na quinta-feira ou em qualquer outro dia da semana?

  • Quando é o momento certo para usar o MariaDB em vez do MySQL e por quê?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve