我正在努力寻找一种解决方案(最好是 DBaaS),我可以依靠它来存储和查询大约 3 亿行数据(大约 100GB)。
有问题的数据几乎是数字。还有一个“描述”列,我想对其执行全文搜索。还有几个用于过滤的“类别”列。我还想以多种方式(10 多个不同的索引)过滤/排序搜索结果。
不需要进行复杂的连接,因为数据几乎是非规范化的。数据更新频繁:每天约有 5000 万条记录被替换。
我首先尝试使用 DynamoDB,但它最多只能支持 5 个索引,并且无法以合理的速度进行全文搜索。我也考虑过谷歌的 BigQuery,但它是为“仅附加”数据而设计的。我现在正在考虑 Redshift,但我不确定它如何能够处理如此大量的每日更新。
任何意见,将不胜感激!