在我的场景中,我有一个 SQL Server Express 作为我的数据源。它定期生成一批数据,这些数据应上传到中央存储库(云中的 SQL Server SE)。数据源知道中央存储库,但中央存储库不知道任何可能的数据源(可能会随着时间的推移而改变)。我不知道 SQL Server Express 是否支持日志传送,也不熟悉这项技术,无论如何,我会指出,出于其他原因,它不是一个可行的解决方案。
我目前的解决方案是在需要时从数据源通过链接服务器(指向云端SQL Server SE)上传所有数据。毫无疑问,这是可行的,但监视中央 SQL Server SE(在云中)时,我看到大量请求。在我看来,阅读文档认为推送数据效率低下,并且会一次推送一行(这解释了我遇到的性能不佳以及中央 SQL Server SE 上的请求量)。
我想知道是否有一种方法可以远程执行由远程 SQL Server 触发的中央 SQL Server 拉取操作。这样我就可以利用这样一个事实:提取数据应该比推送数据更高效,并绕过中央 SQL Server 不知道哪个数据源将在何时联系它的问题。
我们怎么知道从 Central->Edge 比从 Edge->Central 更高效?这看起来像是一个 XY 问题。
链接服务器效率不高,无论是单向还是另一向。理想情况下,这将由应用程序完成,而不是由数据库引擎完成。它还没有考虑防火墙规则或可能需要的任何其他项目。
如果您想要一个外部项目列表,那么由于您知道中央服务器信息,因此可以让外部客户端将其信息放入中央服务器,以便它知道要联系哪个以及何时联系。这也应该通过应用程序完成,而不是直接在数据库引擎中完成。
同样,这没有考虑可能需要的任何其他配置。
您可以通过多种方法实现将数据从本地 SQL Server Express 高效传输到云中的中央 SQL Server SE 的目标。但是,我知道您正在寻找一种解决方案,使中央服务器可以在事先不知情的情况下从本地服务器提取数据。由于安全和连接问题,这可能有点具有挑战性,但这里有一个潜在的策略:
第 1 步:设置 Web 服务或 API 您需要在本地服务器端设置 Web 服务或 API。该服务可以配置为向中央服务器公开必要的数据。您可以使用 ASP.NET Core 或 Flask(适用于 Python)等技术来创建此服务。
第 2 步:安全和身份验证 确保您的 Web 服务或 API 是安全的,利用适当的身份验证和加密来保护您的数据。您可以使用 OAuth、JWT 或其他身份验证机制来保护您的服务。
步骤3:从本地服务器触发从本地服务器,每当有新数据要传输时,您可以向中央服务器发送通知。该通知本质上是向中央服务器请求从本地服务器提取数据。
步骤 4:中央服务器检索数据 收到通知后,中央服务器可以对您的 Web 服务进行 HTTP/REST 调用以检索数据。您必须在中央服务器上开发一种机制来处理这些通知并启动数据检索过程。这可以是侦听通知并在收到通知时检索数据的服务或计划任务。
步骤5:数据导入到中央服务器一旦中央服务器检索到数据,它就会将该数据导入到SQL Server 数据库中。您可以为此使用各种技术(例如批量插入操作)来提高效率。您可以尝试使用 ETL 流程根据频率导入数据。
结论:通过遵循此策略,您将有效地建立一种机制,使中央服务器可以在收到通知后从本地服务器提取数据。这种方法将利用 Web 服务来促进数据传输,为您的问题提供灵活且安全的解决方案。