| 社招官网

达摩院-系统运维工程师-基础平台

发布时间: 2020-04-29 工作地点: 北京 工作年限: 三年以上
所属部门: 阿里集团 学   历: 硕士 招聘人数: 若干

团队介绍:

MIT工程技术资源调度团队,负责构建达摩院基础资源调度平台,并支撑不同场景的高并发在线服务和大规模训练任务,并对平台本身的稳定性和运行效率负责。作为MIT人工智能工程的核心架构团队,我们需要通过技术创新,支持日新月异的人工智能领域发展,建设领先的人工智能资源调度平台,为行业提供先进的AI服务。在这里,通过和集团与社区的合作,你有机会参与世界领先技术的攻关,也有机会参与最先进技术的落地。

岗位描述:

1. 负责调度系统(K8S)核心组件及相关基础设施的日常运维和持续稳定性建设,全方位保证系统的整体服务品质
2. 负责系统或者管控工具的运维架构设计并推进落地,能设计其中的技术细节,有效提升运维效率和运维价值
3. 负责重要系统的业务接入,了解业务场景,从全链路多方位入手改进系统,提升用户体验
4. 负责资源管理和生产效能建设,在保障业务快速发展的同时,降低系统的成本消耗

岗位要求:

1. 3年以上的大规模集群运维经验,熟悉软件开发和系统架构,熟练掌握至少一门编程语言(Go或者Python等)
2. 掌握K8S、虚拟化等相关场景的运行控制和运维管理,对资源调度、容器化等技术体系有深刻的理解
3. 系统工程能力扎实过硬,深入了解系统及上下游链路服务(网络/IO等),具有很强技术敏感度和故障排查经验,并能进行技术方案的整合
4. 熟悉异常监测、故障隔离、主备切换、自动扩缩容等运维系统建设,并有具体的实践经验
5. 了解项目管理和过程控制,具有敏锐的风险意识和良好的风险识别能力
6. 善于团队协作,自我驱动,良好的客户服务意识和抗压能力


有以下一个或多个经验更佳:
1. AI场景、机器学习
2. 弹性调度、资源混部

 

 

申请此职位表明您已阅读并同意阿里巴巴及关联公司的《申请工作机会须知》。

推荐岗位

职位名称 职位类别 工作地点 招聘人数 更新时间
蚂蚁金服-运维高级开发工程师/专家 运维 北京,杭州 若干 2020-05-22
高德-高级运维资深工程师/专家 运维 北京 若干 2020-05-16
新零售技术事业群-高级运维工程师-阿里乡村技术部 运维 杭州 若干 2020-05-14
阿里文娱互动娱乐事业部-高级运维工程师-上海WY 运维 上海 若干 2020-05-07
数字政务中台事业部-高级运维工程师/运维专家-杭州 运维 杭州 若干 2020-04-16