高德 多模态大模型算法工程师/专家 图片/视频理解/模型训练方向-P7

发布时间: 2026-02-13 18:53 工作地点: 北京 薪资: 60万-90万

工作职责:
1. 核心方向:研发面向车道级地图自动化构建的多模态大模型,基于道路图像自动提取车道线、POI信息等地图要素,实现高效、自动化的地图数据生产; 
2. 模型全链路研发:负责或参与多模态大模型的预训练、有监督微调(SFT)、奖励模型(RM)训练与强化学习(RL)优化全流程,探索模型在空间推理、结构化生成任务上的能力强化路径; 
3. 技术攻坚与落地:优化模型的推理效率、泛化能力与输出稳定性,研究适配的模型压缩(量化、蒸馏)、加速技术与部署方案,推动技术在大规模数据生产管线中落地; 
4. 前沿探索与创新:跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展,将其创新性地应用于地图生成问题,持续提升自动化生产的质量与范围。
基本条件:
1. 计算机科学、人工智能、机器学习等相关专业硕士及以上学历,3年以上算法研发经验; 
2. 坚实的多模态大模型基础:深入理解CLIP、BLIP、LLaVA、Qwen-VL等模型的原理,并有相关实践,如有对图片、视频的理解、生成或编辑能力更加分; 
3. 强烈的自驱力与好奇心:对探索AI技术边界充满热情,能主动追踪前沿并快速实验验证,具备优秀的学习能力和韧性。 
优先条件: 
1. 在多模态理解与生成、视觉-语言模型、自动驾驶大模型等相关领域,以第一作者在CVPR/ICCV/ECCV/NeurIPS/ICLR等顶会发表过论文; 
2. 具备将多模态大模型应用于图片/视频生成/理解或复杂场景生成的实际项目经验,有地图相关项目经验者极具优势; 
3. 熟悉大模型高效微调技术(如LoRA、QLoRA)、强化学习对齐(RLHF/DPO)或模型优化加速技术,并有成功落地经验。 
4. 在ACM编程竞赛、Kaggle等顶级算法赛事中获得优异成绩。
任职要求:
基本条件:
1. 计算机科学、人工智能、机器学习等相关专业硕士及以上学历,3年以上算法研发经验; 
2. 坚实的多模态大模型基础:深入理解CLIP、BLIP、LLaVA、Qwen-VL等模型的原理,并有相关实践,如有对图片、视频的理解、生成或编辑能力更加分; 
3. 强烈的自驱力与好奇心:对探索AI技术边界充满热情,能主动追踪前沿并快速实验验证,具备优秀的学习能力和韧性。 
优先条件: 
1. 在多模态理解与生成、视觉-语言模型、自动驾驶大模型等相关领域,以第一作者在CVPR/ICCV/ECCV/NeurIPS/ICLR等顶会发表过论文; 
2. 具备将多模态大模型应用于图片/视频生成/理解或复杂场景生成的实际项目经验,有地图相关项目经验者极具优势; 
3. 熟悉大模型高效微调技术(如LoRA、QLoRA)、强化学习对齐(RLHF/DPO)或模型优化加速技术,并有成功落地经验。 
4. 在ACM编程竞赛、Kaggle等顶级算法赛事中获得优异成绩。

简历提交评估