我们是字节跳动--基础架构--应用观测(服务端)团队, 专注于 PB 级别海量数据的可观测性基础设施 [Metrics 、Tracing 、Logging 、Event 、Profiling] 和上层可观测性应用[E.g. 报警生命周期管理、异常检测、 根因分析]的建设, 为字节跳动整体业务的稳定性、性能优化、服务治理等方向保驾护航.
关于我们的更多介绍, 参考下面的分享: Archsummit: “演讲:字节跳动可观测性平台实践的“中场故事” https://archsummit.infoq.cn/2021/shanghai/presentation/3372
职位描述
字节跳动 APM(Application Performance Management) 团队负责公司所有服务端、移动端、 前端、 跨端产品的稳定性和性能质量监控保障,构建业界领先的可观测性基础设施,结合机器学习智能化,提供一站式平台覆盖字节跳动各业务线的排障、监控和稳定性提升等需求。
1 、负责字节跳动监控相关产品核心功能开发,打造一站式链路诊断、归因、报警、修复平台;
2 、负责字节跳动 ToB 监控观测组件产品研发;
3 、推动字节跳动内部 APM 相关的基础技术持续深化发展建设;
4 、参与内部基础技术和 ToB 相关实践整合,提升基础工程复用度。
职位要求
1 、能熟练使用一种编程语言,包括不限于 Golang/Python/Java/Rust/C++/C ;
2 、熟悉使用 Linux 操作系统,了解存储、网络 IO 等相关原理;
3 、熟悉大型分布式存储系统,比如 hive ,clickhouse ,prometheus ,influxdb ;
4 、掌握 Mysql 、Redis 、MQ 等常用存储系统的使用。
具备以下条件之一者优先:
1 、有监控相关领域实践经验;
2 、有监控、报警、日志等领域开发经验;
3 、有云原生监控相关工作经验。
职位描述
字节跳动 APM(Application Performance Management) 团队负责公司所有服务端、移动端、 前端、 跨端产品的稳定性和性能质量监控保障,构建业界领先的可观测性基础设施,结合机器学习智能化,提供一站式平台覆盖字节跳动各业务线的排障、监控和稳定性提升等需求。
1 、负责字节跳动基础设施可观测性方向的探针和 Agent 建设;
2 、持续优化接入侧链路性能,持续降低成本;
3 、对接公有云多套可观测性产品接入需求,触达业务价值。
职位要求
1 、5 年及以上互联网后端开发经验,具备高并发场景下设计、编码、优化及问题排查能力;
2 、3 年以上监控系统开发经验,精通 Kubernetes 、Prometheus 以及 Grafana 等开源监控工具的使用和原理;
3 、精通 go/java/cpp 语言开发,能写出优雅、高质量的代码;
4 、自我要求高,对新技术学习能力强,具备良好的沟通能力、团队协作能力。
具备以下技能 /经验者优先:
1 、参与 Metrics 、Tracing 、Logging 、Event 可观测性等数据支柱建设,对上层应用产品表达有一定理解度;
2 、对于性能优化 /ebpf 使用开发 /字节码采集等有实践;
3 、深度参与 Apache SkyWalking/OpenTelemetry/Jaeger 或相关 agent 开发;
4 、深度参与 CNCF monitoring/logging/tracing 项目。
简历发送至邮箱 [email protected] 注明来自 v2ex
1
izzy27 2022-10-13 01:05:19 +08:00
招应届生嘛
|
2
liuhaoyang OP @izzy27 应届生有点困难。职位要求到 2-1 的层级
|