在数据存储方面,我是个新手,想学习一些技巧。
我想知道如何在 RDBMS 和 NoSQL 存储之间做出选择。
让我们举一个数据量相当大(比如 TB)的系统的例子。而且我们还需要强一致性,而且还需要低延迟。
考虑到数据大小,NoSQL 可能比较合适,但出于一致性原因,RDBMS 类型可能看起来不错。但高一致性意味着低延迟。
尽管一些 RDBMS 也提供分片来解决大数据问题,但延迟仍然是一个问题。
我们如何权衡所有这些利弊来做出决定?
此外,来自初学者 POV 的有关此主题的任何资源可能会有很大帮助。
RDBMS 非常适合存储核心数据。
继续使用它们,就像我们 20-30 年前使用它们一样。几乎没有任何改变。
NoSQL 适合存储日志、JSON、XML。
30-20 年前,我们将日志存储到
.log
,.csv
,.txt
,.json
..xml
今天,我们仍然将它们存储在相同的文件中,但我们在其之上添加了一个 NoSQL 引擎来深入研究日志并大规模读取日志。