我每天晚上都会创建一些汇总数据并存储在 S3 存储桶中,按日期分区。我执行 anALTER TABLE foo ADD PARTITION...
在创建时将每个新分区添加到 Athena。我已经能够验证这是否成功添加了数据,并且我可以在 Athena 中查询它。到目前为止,一切都很好。
我现在想做的是自动滚动超过 30 天的数据。我可以设置一个生命周期规则来从 S3 中删除旧数据;这也会自动将其从 Athena 中删除,还是我需要在 Athena 本身中直接采取措施将其从表中删除?
当我简单地删除 S3 中的分区时,它似乎可以正常工作,但我找不到任何明确的说法,表明这是处理此问题的推荐方法。