现在常用的数据同步方案有哪些？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1123 天前的主题，其中的信息可能已经有所发展或是发生改变。

最近工作遇到了一个需求需要设计一个类似通用的数据汇集平台，需要把用户配置的数据源（主要是 Oracle 和 MySQL ）中的表以全量和定时增量的方式同步到本平台的数据库

目标数据源的表多的可能上亿条数据，同时平台需要向用户体现当前的同步任务进行的状态，主要是已同步的数据条数、本次同步新增数量、修改数量以及任务的完成情况这些的

由于本人对这大批量的数据没什么经验，目前想到的方式：自己写代码用变更时间作增量字段来查询插入；这种方式的问题是全量同步时我该如何确认每次查询批次的数据条目数量不能太多，防止数据库压力太大或者 JVM 内存溢出？用数据库 limit 或者 rownum 来确认数量的话在千万或上亿的表中随着数量变大速度会越来越慢，感觉不是一个很好的方式。

思考了一下一时半会找不到合适的方式，所以来请教下 v2er 指点下有没合适的解决方案😂 感谢

同步

数据

数据库

数量

9 条回复 • 2023-01-02 14:26:46 +08:00