AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1014301
Accepted
Joe McMahon
Joe McMahon
Asked: 2020-04-27 14:05:27 +0800 CST2020-04-27 14:05:27 +0800 CST 2020-04-27 14:05:27 +0800 CST

滚动 Athena 表中的旧分区

  • 772

我每天晚上都会创建一些汇总数据并存储在 S3 存储桶中,按日期分区。我执行 anALTER TABLE foo ADD PARTITION...在创建时将每个新分区添加到 Athena。我已经能够验证这是否成功添加了数据,并且我可以在 Athena 中查询它。到目前为止,一切都很好。

我现在想做的是自动滚动超过 30 天的数据。我可以设置一个生命周期规则来从 S3 中删除旧数据;这也会自动将其从 Athena 中删除,还是我需要在 Athena 本身中直接采取措施将其从表中删除?

当我简单地删除 S3 中的分区时,它似乎可以正常工作,但我找不到任何明确的说法,表明这是处理此问题的推荐方法。

amazon-web-services lifecycle
  • 3 3 个回答
  • 1459 Views

3 个回答

  • Voted
  1. MLu
    2020-04-27T14:12:18+08:002020-04-27T14:12:18+08:00

    IIRC 我们每晚使用Glue Crawler重新扫描 S3 并重新创建 Athena 表。不是 100% 确定是否需要,也许不需要。虽然不疼:)

    • 0
  2. Best Answer
    Joe McMahon
    2020-05-22T15:14:14+08:002020-05-22T15:14:14+08:00

    经过一些实验后,Athena不会删除对由 S3 操作删除的对象的引用,或者至少不会立即删除——“最终一致性”可能会在某个时候解决问题,但如果您希望它在短时间内发生术语你需要自己做。如果您真的希望它们消失,您必须使用这些ALTER TABLE分区。DROP

    我通过以不同名称多次上传文件并删除除一个以外的所有文件来验证这一点。查询显示COUNT(*),在删除后几分钟内,Athena 仍然可以看到这些记录,但DROP PARTITION/ADD PARTITION操作立即清除了它们。

    因此,我不会指望常规的 S3 生命周期管理来照顾 Athena。

    • 0
  3. Tinman
    2022-07-27T03:57:32+08:002022-07-27T03:57:32+08:00

    看看这个页面。它向您展示了如何使用 BOTO3 或 CLI 批量过滤和删除分区。

    如前所述,从 s3 中删除文件不会将它们从 Glue 目录元数据中删除。从胶水中去除它们也不会从 S3 中去除它们。这两个操作必须独立完成。

    • 0

相关问题

  • 与 AWS 中的其他系统相比,CentOS 报告的总内存较低

  • 如何在 Amazon Linux 服务器上升级到 Java 1.8?

  • 了解 Amazon AWS 使用数据

  • 亚马逊提供的负载均衡服务体验如何?

  • ELB 中现有节点的 AWS 自动缩放问题

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve