基础架构-SRE 工程师
上海·社招·正式
职位描述
1 、负责字节跳动基础设施的系统高可用架构和规划;
2 、设计并实现能够保障线上大规模集群的迭代、自动化运维平台;
3 、负责量化云服务的服务质量,提升服务 SLA 标准;
4 、支持平台用户线上需求和解决用户遇到的各种问题;
5 、升整体云平台的运维管理效率。
职位要求
1 、有大型系统的运维管理经验,2 年以上相关工作经验;
2 、精通 Linux 系统、Shell/Python/C 等编程语言、网络 TCP/IP 协议、数据库等,动手能力强;
3 、较强的分析和解决问题的能力,强烈责任感、 缜密的逻辑思维能力;
4 、有较强的系统问题分析经验和能力,能够解决复杂的系统问题;
5 、有大型云计算公司从业经验,对 openstack 系统开发、测试、运维、应用工作经验者,熟悉源码优先;
6 、有监控系统构建研发经验优先。
## 监控组件介绍
字节跳动全网监控生态建设,包括智能报警和智能监控产品,涉及海量 PB 级数据生命周期管理,由此推动线上稳定性保障、故障诊断、容量管理和服务治理等能力构建。
### 非具体组件开发,对监控组件自身的稳定性自动化负责
联系 vx jpc324537
简历投递邮箱
[email protected]