平台驻场运维

发布时间: 2025-10-22 01:53 工作地点: 珠海 薪资: 17-20万

必备条件:
统招本科
三年及以上工作经验
优先条件:
云计算
岗位职责:
1、智算平台运维:负责大规模GPU集群平台的日常运维与监控,确保平台稳定运行(N卡/国内GPU卡);
2、系统部署与管理:协助进行服务器、存储设备及网络设备的上架、部署、配置、管理与维护;
3、故障排除与性能调优:及时响应GPU集群软硬件、网络及操作系统故障,进行排查与处理,优化系统性能,保障平台的高效运行;
4、巡检:定期对智算平台GPU节点及网络设备软硬件、服务等进行巡检,按时提交高质量日常报告;
5、文档维护:编写与更新运维文档,包括配置文件、操作手册和故障排查记录;
任职要求:
1、熟悉 Linux 系统管理与操作(如 CentOS、Ubuntu 等)及排障;
2、熟悉常见的云平台(如阿里云、腾讯云、AWS)及虚拟化技术
3、熟悉容器化技术,如docker/k8s等,有cka证书优先; ---重点
4、具备一定的监控工具使用经验(如 Prometheus、Grafana、Zabbix 等);
5、熟悉Python、Shell、Go等一种或多种编程语言

简历提交评估