工作职责:
1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成;
2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等);
3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地;
4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。
1、5年及以上工作经历,计算机科学、人工智能等相关专业硕士及以上学历;
2、熟悉多模态领域的重要算法和模型(如Qwen-VL、CLIP、Stable Diffusion等),掌握LoRA、SFT、RL等训练方法,有实际项目经验者优先;
3、熟练使用pytorch/deepspeed/transformers/ms-swift等框架,具备扎实的Python或C++编程能力;
4、在学术顶级会议(如CVPR、ICLR、NeurIPS等)发表过相关论文者优先;
5、具备较强的学习能力,能够快速掌握新技术,对新技术充满好奇心,具备高度的自驱力和韧性。
任职要求:
1、5年及以上工作经历,计算机科学、人工智能等相关专业硕士及以上学历;
2、熟悉多模态领域的重要算法和模型(如Qwen-VL、CLIP、Stable Diffusion等),掌握LoRA、SFT、RL等训练方法,有实际项目经验者优先;
3、熟练使用pytorch/deepspeed/transformers/ms-swift等框架,具备扎实的Python或C++编程能力;
4、在学术顶级会议(如CVPR、ICLR、NeurIPS等)发表过相关论文者优先;
5、具备较强的学习能力,能够快速掌握新技术,对新技术充满好奇心,具备高度的自驱力和韧性。