[部门介绍]
阿里巴巴集团数据库事业部的 OLAP 产品部,专注于提供全球领先的全栈式大规模 OLAP 产品,目前在阿里集团、公共云、专有云提供了分析型数据库 AnalyticDB 、Data Lake Analytics 、TSDB 等多个产品,得到了大规模应用;每天数据写入记录数在万亿级,查询请求十亿级。
分布式计算引擎团队,打造支持异构数据源、结构化和非结构化数据的大规模高性能分布式分析引擎,支持 Hadoop 、Spark 等开源生态。支持单集群千台规模,计算能力全球领先的开放计算能力引擎。
[岗位职责]
1. 分布式计算引擎内核开发,包括查询引擎优化,执行计划调优等;
2. 依托开源社区,为业务提供先进的分布式计算能力和大数据解决方案;
3. 与开源社区保持良性互动,调研 /吸收开源经验的同时,回馈社区。
[职位要求]
1. 有 4 年以上分布式查询框架的开发、优化经验并在生产环境得到大规模应用;
2. 对 Hadoop/Presto/Spark/Flink 以及类似分布式系统中的至少一个有深入研究;
3. 精通 JAVA 或者 C/C++,有 Linux 下丰富的应用性能诊断和优化经验; 至少会一种脚本语言
4. 有强烈的上进心和求知欲,善于学习新事物,对技术充满激情 ;
5. 具有较强的团队合作能力,勇于面对和解决挑战性问题。
[加分项]
1. 熟悉 Orca/Calcite/SparkCatalyst;
2. 有开源社区贡献者优先,Hadoop/Hive/Hbase/Spark/Beam/Yarn 源码熟悉;
3. Linux 内核经验 、JVM 经验
[联系方式]
1. 邮箱:haicen.typ#
alibaba-inc.com (#换成 @)
2. 微信:sudorm
HC 多多,年底聊完,拿完年终奖入职~~