AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 2967
Accepted
Marco Aviles
Marco Aviles
Asked: 2011-05-27 20:50:33 +0800 CST2011-05-27 20:50:33 +0800 CST 2011-05-27 20:50:33 +0800 CST

数据库复制和一致性检查

  • 772

我有一个关于我拥有的两个数据库(在 Oracle 10g 中)的问题,我们称它们为 A 和 B。A 有一些信息(在各种表中),我希望 B 从 A 获取一些表的部分副本,并不断检查A 中的更改并在 B 中“同步”它们。

我想问你一些方法、技术或者想法,我知道我不能对 A 做任何改变(只是选择,没有触​​发器)。

我提前感谢您的帮助和耐心(可能的编辑)。

附加信息:

感谢您的回答,我不知道它是否相关,但我找到了 MINUS 运算符,但我不确定它是否适用于“子表”(选择)。

oracle replication
  • 3 3 个回答
  • 1715 Views

3 个回答

  • Voted
  1. Best Answer
    Leigh Riffel
    2011-05-28T06:10:32+08:002011-05-28T06:10:32+08:00

    由于您要求“不断检查...同步”和“不能对 A 进行任何更改”,因此您的选择相当有限。诸如物化视图日志、dbms_alert、流和备用数据库之类的东西都不在表中。

    如果 A 中的表不断更新其所有行,那么(正如杰克道格拉斯所说)物化视图将是最容易设置的。如果大多数记录在 A 中不时更改,您可能希望在 B 上设置一个(或多个)包,从 A 中选择以在 B 上根据需要合并和删除。这将仅与运行频率一样最新,但考虑到您的要求,它可能是您能做的最好的。

    具体来说,您的包应该执行以下操作:

    • 从 B 中删除 A 中不存在的行。
    • 将 A合并到 B 中,匹配时更新,不匹配时插入。

    如果您想避免多次点击 A 中的表,您可以将整个表插入到 B 上的全局临时表中,然后从那里执行删除/合并。

    关于减号: 减号可以告诉您 A 的查询中不在 B 中的所有行。通过将其与 B 的减号查询联合起来,您可以获得所有不同的行,但这可能需要更长的时间来处理甚至在添加插入/更新部分之前。如果 A 没有得到更新或删除,那么您可以插入第一个减号的结果,但 aninsert into B...where not exists A...仍然会更快更简单。

    • 5
  2. Jack Douglas
    2011-05-27T21:39:52+08:002011-05-27T21:39:52+08:00

    除了轮询之外,没有办法知道 A 中的表已更改。您可以考虑物化视图,定期刷新,它可以在 dblink 上工作 - 但只有完全刷新是可能的,所以这可能只有在表很小的情况下才实用。

    • 4
  3. Kerri Shotts
    2011-06-02T21:01:31+08:002011-06-02T21:01:31+08:00

    艰难的一个,因为您除了 db_A 中的 SELECT 之外没有任何访问权限。所以这是一个想法,但它需要一些可能(或可能不会)满足的非常严格的假设:

    要求:

    • 所有正在同步的表都具有:
      • 时间戳(分辨率越高越好)
      • 唯一的顺序 ID
    • 所有表行,一旦同步,就不会改变。
      • 或者,如果确实发生了更改并更新了记录上的时间戳,您也许可以这样解决。

    现在,在 db_B 上:

    CREATE TABLE table1...
    CREATE TABLE table2...,
    etc.
    
    PROCEDURE SYNC_TABLE1 IS
        MAX_ACTIVITY_DATE DATE;
        MAX_SEQUENCE_NO NUMBER;
    
        BEGIN
            SELECT MAX(SEQUENCE_NO), MAX(ACTIVITY_DATE) 
              INTO MAX_SEQUENCE_NO, MAX_ACTIVITY_DATE
              FROM table1;
        EXCEPTION WHEN NO_DATA_FOUND THEN
            MAX_SEQUENCE_NO := 0;
            MAX_ACTIVITY_DATE = TO_DATE('01/01/1980', 'MM/DD/YYYY');
        END;
    
        -- Bring over recent entries from db_A.table1 to db_B.table1
    
        INSERT INTO table1
        SELECT *
          FROM table1@db_A
         WHERE
               -- if using timestamps as your criteria:
               activity_date > MAX_ACTIVITY_DATE
               -- if using sequence nos as your criteria:
               sequence_no > MAX_SEQUENCE_NO
        ;
    
        -- consider adding limiters to decrease the bandwidth necessary
        -- for large transactions. For example activity_date < MAX_ACTIVITY_DATE + 30
        -- would load a month's worth of transactions at a time. sequence_no <
        -- MAX_SEQUENCE_NO + 500 would load 500 transactions at a time.
    
        COMMIT;
    EXCEPTION WHEN OTHERS THEN
        ROLLBACK;
        -- Consider logging the error!
        RAISE;
    END;
    (lather, rinse, repeat.)
    

    同样,这仅在您具有连续唯一 ID 或始终在 db_A 上更新的活动日期时才有效(并且该日期应该具有足够的分辨率以检测在前一个事务之后插入一毫秒的事务,因此时间戳是最好的。)

    我在 Oracle 实例(和非 Oracle 实例,例如,Oracle 到 mySql)之间同步数据的方式是确保我的所有可同步表上都有一个 sync_date 列。当请求同步数据时,该 sync_date 列将填写同步日期。因此实际的同步过程很简单:

    FOR r in ( SELECT * FROM table1
                WHERE sync_date IS NULL ) LOOP
        send_sync_data_somewhere;
        UPDATE table1
           SET sync_date = current_timestamp
         WHERE rowid=r.rowid;
    END LOOP;
    

    通常限制器会生效,但你明白了。此外,如果记录上的数据发生更改,则 sync_date 列为 NULL,此时同步过程将重新拾取它。

    注意:无论哪种情况,如果您能够在同步行后支持数据更改,您将需要某种重复数据删除处理。您可以尝试 MERGE,或在 SELECT 子句上使用 WHERE NOT EXISTS 加上 UPDATE ... WHERE EXISTS 的 INSERT。

    希望这会有所帮助。

    • 3

相关问题

  • ORDER BY 使用文本列的自定义优先级

  • 舒服的sqlplus界面?[关闭]

  • 如何在数据库中找到最新的 SQL 语句?

  • 如何使用正则表达式查询名称?

  • PostgreSQL 9.0 Replication 和 Slony-I 有什么区别?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve