模型训练框架研发工程师(短期外包)

发布时间: 2025-08-03 02:35 工作地点: 深圳 薪资: 24-48万

必备条件:
统招本科,学信网可查,双证齐全。
优先条件:

岗位职责:
1.参与开发优化大模型训练框架,支持单任务万卡以上规模高效稳定训练;
3.参与训练性能加速;
4.参与低精度训练性能优化和业务推广、参与大窗口训练性能优化。
任职要求:
1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化;
2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向;
3.有ViT、SD、DiT模型训练性能优化经验者优先;
4.熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先;
5.对大模型前沿技术比较敏锐者优先;
6.有实际大模型的训练调参和效果评测项目经验的优先;
7.良好的沟通能力、解决问题能力。

简历提交评估