AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 254446
Accepted
Francesco Mantovani
Francesco Mantovani
Asked: 2019-11-30 05:39:05 +0800 CST2019-11-30 05:39:05 +0800 CST 2019-11-30 05:39:05 +0800 CST

如何维护一个永远运行的查询?

  • 772

我想运行一个查找素数的查询,并且我想永远运行它。

@Solomon Rutzky 在这个页面上给定范围内的素数,给我们一个关于埃拉托色尼筛的好例子。

DECLARE  @RangeStart INT = 1,
         @RangeEnd INT = 100000;
DECLARE  @HowMany INT = CEILING((@RangeEnd - @RangeStart + 1) / 2.0);

;WITH frst AS
(
    SELECT  tmp.thing1
    FROM        (VALUES (0), (0), (0), (0), (0), (0), (0), (0), (0), (0)) tmp(thing1)
), scnd AS
(
    SELECT  0 AS [thing2]
    FROM        frst t1
    CROSS JOIN frst t2
    CROSS JOIN frst t3
), base AS
(
    SELECT  TOP( CONVERT( INT, CEILING(SQRT(@RangeEnd)) ) )
            ROW_NUMBER() OVER (ORDER BY (SELECT 1)) AS [num]
    FROM        scnd s1
    CROSS JOIN  scnd s2
), nums AS
(
    SELECT  TOP (@HowMany)
            (ROW_NUMBER() OVER (ORDER BY (SELECT 1)) * 2) + 
                (@RangeStart - 1 - (@RangeStart%2)) AS [num]
    FROM        base b1
    CROSS JOIN  base b2
), divs AS
(
    SELECT  [num]
    FROM        base b3
    WHERE   b3.[num] > 4
    AND     b3.[num] % 2 <> 0
    AND     b3.[num] % 3 <> 0
)
SELECT  given.[num] AS [Prime]
FROM        (VALUES (2), (3)) given(num)
WHERE   given.[num] >= @RangeStart
UNION ALL
SELECT  n.[num] AS [Prime]
FROM        nums n
WHERE   n.[num] BETWEEN 5 AND @RangeEnd
AND     n.[num] % 3 <> 0
AND     NOT EXISTS (SELECT *
                    FROM divs d
                    WHERE d.[num] <> n.[num]
                    AND n.[num] % d.[num] = 0
                    );

所以我们可以很容易地生成一个从 0 到 100 的所有素数的列表。

但是假设我希望查询在接下来的 20 年内运行,所以我设置了一个非常大的数字:

DECLARE  @RangeStart INT = 1,
         @RangeEnd INT = 100000000000000000000000000000000000000000000000000;

这就是问题所在:我如何才能在接下来的 20 年内维护这个查询?

因为埃拉托色尼筛法有一个特点:

如果它被中断,你必须从头开始。

所以我的问题从这里开始:

  • 我如何设法更换 CPU、升级 RAM、更换硬盘等...
  • 如何管理故障转移灾难场景以避免该脚本停止?
  • 故障转移会保证查询不会停止吗?
  • 云冗余和故障转移到不同的提供商(Azure / AWS / GCE)这将确保脚本不会停止吗?
  • 如果故障转移是从 Azure 到全球 2 个不同地区的 AWS 怎么办?此故障转移会保持存储过程运行吗?

现在是灾难恢复部分:

  • 我可以备份,比如说每个月,该存储过程的状态,并最终从该映像恢复吗?
  • 如果我在虚拟机上运行存储过程并拍摄快照,我可以恢复存储过程吗?

我确信有人在这样做:这个分解素数的在线数据库http://factordb.com/status.php已经成功地从 200MB(2014 年)增加到今天(2019 年)的近 800MB。

在此处输入图像描述

t-sql failover
  • 3 3 个回答
  • 237 Views

3 个回答

  • Voted
  1. pixiemops
    2019-11-30T05:49:42+08:002019-11-30T05:49:42+08:00

    修改脚本会更容易,以便它写出最后一个值,或者每 n 次写出一个值,以便您可以在失败的情况下使用最后一个已知值重新启动脚本。Linux 硬件非常可靠,我有超过 4 年正常运行时间的服务器,但当然没有任何保证。

    • 4
  2. Best Answer
    Michael Kutz
    2019-12-04T14:34:27+08:002019-12-04T14:34:27+08:00

    第一个想法

    你有一个 XY 问题。您需要使用允许您从特定点重新启动的算法。

    代码审查

    • Dividend.num <=@endnum存在于两个地方。
      • 摆脱第二个
    • Divisor.num between 2 and sqrt(dividend.num) is more restrictive than Divisor.num <= @endnum`。
      • 摆脱限制较少的那个。
    • 由于NOT EXISTS对所有行使用适当的行范围Dividend...
      • 您可以安全地更改Dividend.num <= @endnum为Dividend.num between @startnum and @endnum
    • 一次生成 T16M 将允许您重复使用结果
      • 即:make是正则表

    算法笔记

    既然 SQL 语句定义了一个 RANGE……你可以运行 20 年

    对于 A 和 B 之间的所有数字:

    1. 将它们分成更小、更易于管理的范围。
    2. 并行运行 n 个块

    与分段筛法不同,您使用每个块的所有值,而不仅仅是已知的素数。

    分段筛

    实施分段筛所需的更改

    • 关键是使用表 T16M 中的值,而不是 CTE。
    • 修改代码以删除 T16M 中的非质数。(例如DELETE FROM T16M WHERE num in ( .... ))
    • 以最低到最高的顺序连续运行每个块。

    笔记

    宇宙的寿命(以及所需的磁盘空间量)可能会限制你能找到多大的数字。

    原始问题关注

    1. 长期运行系统

    Voyager 1/Voyager 2 是 40 年以来运行时间最长的计算机程序之一。

    https://www.space.com/26041-nasa-voyager-probes-solar-system-legacy.html

    航海者号为每个航天器使用三个双冗余计算机系统。 https://history.nasa.gov/computers/Ch6-2.html

    1. 添加 CPU/RAM/磁盘

    可以通过 SAN 系统添加/更换磁盘。

    热添加物理 CPU/RAM 可能需要非英特尔设备。

    CPU 和内存资源可以无中断地添加到系统中...... https://en.wikipedia.org/wiki/IBM_Z

    分块

    Oracle 用户可以使用它DMBS_PARALLEL_EXECUTE来创建块并运行它们。其他 RDBMS 将需要实现自己的 API 来执行此操作。

    • 4
  3. Abecee
    2019-12-04T12:38:30+08:002019-12-04T12:38:30+08:00

    初步评论:关于改变方法的可行性有一些(现已删除)评论,该方法允许重新启动基于 Eratosthenes 筛子的素数搜索……

    以下内容应该可以工作:

    设置阶段/种子:

    CREATE TABLE Prime (
        id INT NOT NULL IDENTITY PRIMARY KEY,
        prime INT NOT NULL UNIQUE
    );
    CREATE TABLE LastOne (
        id INT NOT NULL PRIMARY KEY
    );
    BEGIN TRANSACTION;
      INSERT INTO Prime (prime) VALUES (2);
      INSERT INTO LastOne VALUES (2);
    COMMIT;
    

    尽可能做好工作准备:

    CREATE PROC dbo.SieveOfEratosthenes AS
    DECLARE
        @nextPrimeCandidate INT = NULL
    BEGIN
      SET @nextPrimeCandidate = (
        SELECT id + 1
        FROM LastOne AS Dividend
        WHERE
          (Dividend.id + 1) % 2 = 1
          AND
          NOT EXISTS (
            SELECT 1
            FROM Prime
            WHERE
              prime BETWEEN 2 AND SQRT(Dividend.id + 1)
              AND
              (Dividend.id + 1) % prime = 0
        )
      )
      ;
      BEGIN TRANSACTION
        IF (@nextPrimeCandidate IS NOT NULL)
        INSERT INTO Prime (prime) VALUES (@nextPrimeCandidate);
        UPDATE LastOne SET id = id + 1;
      COMMIT;
    END;
    

    在行动中看到它:db<>fiddle。

    注意:只是想法 - T-SQL 并不是我真正喜欢的...

    如果需要调整/进一步详细信息,请发表评论。

    • 0

相关问题

  • 如何使用 TSQL 更改 SQL 服务器配置管理器设置?

  • 如何从结果集中获取列名和类型的列表?

  • MS SQL:使用计算值计算其他值

  • 如何判断 SQL Server 数据库是否仍在使用?

  • 实施 PIVOT 查询

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve