有一批数据在数据库中,分 128 表按小时增量存储,现在有多个机器 每一小时处理一次,这些机器是消费者角色, 每个小时生产数据后,及时消费处理这些数据,待这个小时的数据全部处理完成后 汇总这一个小时的数据,这里面涉及多个分布式协调问题, 请教一个比较好的解决方案?
注意点
谢谢大家啦!麻烦大家推荐案例或者书籍或者大致思路, 不甚感激!!
1
billlee 2020 年 8 月 8 日
这不是典型的 map reduce 问题吗?直接用 spark 得了
|
3
lhx2008 2020 年 8 月 8 日
这种就是流式计算之类的,不要自己写轮子了,也没有必要用 sql 分表什么的。。
|