AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 344247
Accepted
adinas
adinas
Asked: 2024-12-17 17:58:10 +0800 CST2024-12-17 17:58:10 +0800 CST 2024-12-17 17:58:10 +0800 CST

Cassandra 数据库中的墓碑未被删除

  • 772

我认为 Cassandra 4.1.7 表中的墓碑不会被删除。

该表的 gc_grace_seconds = 345600

即使在运行之后nodetool garbagecollect(删除后远晚于 4 天),如果我运行,nodetool tablestats我会得到以下结果:

在此处输入图片描述

执行垃圾收集后,磁盘大小也不会减少。

我不确定我过去是否跑过nodetool compact(我想这意味着我需要继续使用它?)

附带问题,如何让 tablestats 返回更新的信息(而不是从 2024-12-12 开始)

谢谢

cassandra
  • 2 2 个回答
  • 60 Views

2 个回答

  • Voted
  1. Aaron
    2024-12-20T02:40:59+08:002024-12-20T02:40:59+08:00

    听起来好像压缩没有运行。这很糟糕,但即使手动运行一次,也会出现这种情况。

    尝试运行SELECT * FROM system.compaction_history。如果有问题的 keyspace.table 有一段时间没有运行,您可能需要开始安排它定期运行。

    压缩该表后,请nodetool tablestats再次查看。如果没有显著改善,那么这里可能存在其他问题。

    编辑 20241223

    我确实在表中看到了此表的行,compaction_history包括今天的行。bytes_out 字段显示的数字略低于 bytes_in 字段。这是否意味着我不应该运行nodetool compact?

    我还是不会跑nodetool compact。

    是否启用了快照?如果压缩确实在运行,则旧快照可能与一个或多个 SSTable 有硬链接。如果是这样,请查看清理一些旧快照,然后查看压缩是否会自行再次运行。

    • 2
  2. Best Answer
    Erick Ramirez
    2025-01-08T11:13:26+08:002025-01-08T11:13:26+08:00

    该nodetool garbagecollect命令专门用于从表中删除已删除的数据,不一定是墓碑数据。

    这里要注意的是,如果删除了整个分区,墓碑将被删除garbagecollect。我认为这不适用于您的情况,因为看起来您正在删除分区内的行。行墓碑不一定会被删除,特别是如果分区的片段仍然存在于其他 SSTable 中。

    您发布的屏幕截图显示了包含数百万行墓碑的分区。这表明您正在使用 Cassandra 来管理队列,并在处理完条目(行)后将其删除。

    队列和类似队列的数据集不适合 Cassandra,因为它们积累了太多的墓碑(请参阅博客文章队列是一种反模式)。对于您来说,您手动触发压缩作为一种解决方法,但这会产生其他问题,正如我在另一篇文章中解释的那样(请参阅为什么强制进行主要压缩并不理想)。

    短期内,除了继续做你正在做的事情,你真的没有太多选择。长期解决方案是审查你的用例并可能重新设计你的数据模型。干杯!

    • 1

相关问题

  • 具有 1 个外部 IP 的 Cassandra 多数据中心配置

  • 迁移中的 Cassandra 升级/修复问题

  • Cassandra cqlsh 浏览器查询只能以字节为单位

  • 在 Cassandra 中使用许多(数千个)列族或键空间会有什么后果?

  • Cassandra 静态加密

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve