据我了解,当您为表启用 StretchDB 功能时,基本上会在本地创建一个链接服务器,该服务器将远程服务器作为将数据移动到的目标。
如果这是正确的,这是否意味着他们会遇到同样的问题?如:
- 获取所有数据然后过滤
- 可怕的数据统计
Kendra Little在 Brent Ozar 的网站上有一段Youtube 视频概述了其中的一些问题。
据我了解,当您为表启用 StretchDB 功能时,基本上会在本地创建一个链接服务器,该服务器将远程服务器作为将数据移动到的目标。
如果这是正确的,这是否意味着他们会遇到同样的问题?如:
Kendra Little在 Brent Ozar 的网站上有一段Youtube 视频概述了其中的一些问题。
拉伸数据库的限制
并非所有表格都符合启用 Stretch 的条件。不支持某些表属性、数据和列类型、约束和索引,例如:
内存优化和复制表包含 FILESTREAM 数据的表,使用更改跟踪或更改数据数据类型,例如时间戳、sql_variant、XML、地理或始终加密的列检查和默认约束或引用表 XML 的外键约束,完整- 引用启用了 Stretch 的表的文本、空间、聚集列存储和索引视图您不能运行 UPDATE 或 DELETE 语句,或者在启用 Stretch 的表上运行 CREATE INDEX 或 ALTER INDEX 操作
它有一组与您列出的问题不同的问题(请参阅https://msdn.microsoft.com/en-us/library/mt605114.aspx)。
首先,它使用外部数据源,而不是链接服务器。虽然在功能上非常相似,但外部数据源是一个数据库级对象,因此它与数据库一起移动。链接服务器是驻留在 master 中的实例级对象,当您需要将启用了 StretchDB 的数据库移动/恢复到另一个实例/服务器时,需要额外的工作。
stretch 目标是由为 StretchDB 工作负载配置的 SQL Server 引擎提供支持的 Azure 服务。它不仅仅是一个文件或 blob。因此,确实会发生查询和谓词下推,因此您只是拉回已被查询谓词过滤的内容,而不是整个数据集。否则,这马上就没用了,因为它旨在保留 TB 的冷数据。我确定存在无法按预期工作的边缘情况,但这种情况应该很少见。性能可能仍然很差,但对于一些边缘情况的查询。例如,您在本地和远程数据集之间执行嵌套循环连接。其中一些可以优化或暗示,但我确信在某些情况下这是不可能的。对于那些人来说,查询性能可能非常糟糕,使他们成为 StretchDB 的不良/非候选者。
至于统计数据,目前创建和管理它们是一个手动过程,但在引擎中启用自动统计管理并不是一件非常困难的事情,所以我想这在未来应该不会太远。在此之前,您需要通过 SSMS/sqlcmd 直接连接到 Azure 中的 StretchDB 数据库以创建统计信息,然后以适当的时间间隔更新它们。