北京 Recruit 高德多模态大模型算法工程师/专家图片/视频理解/模型训练方向-P7 -

工作职责：
1. 核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产；
2. 模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径；
3. 技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地；
4. 前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。
基本条件：
1. 计算机科学、人工智能、机器学习等相关专业硕士及以上学历，3年以上算法研发经验；
2. 坚实的多模态大模型基础：深入理解CLIP、BLIP、LLaVA、Qwen-VL等模型的原理，并有相关实践，如有对图片、视频的理解、生成或编辑能力更加分；
3. 强烈的自驱力与好奇心：对探索AI技术边界充满热情，能主动追踪前沿并快速实验验证，具备优秀的学习能力和韧性。
优先条件：
1. 在多模态理解与生成、视觉-语言模型、自动驾驶大模型等相关领域，以第一作者在CVPR/ICCV/ECCV/NeurIPS/ICLR等顶会发表过论文；
2. 具备将多模态大模型应用于图片/视频生成/理解或复杂场景生成的实际项目经验，有地图相关项目经验者极具优势；
3. 熟悉大模型高效微调技术（如LoRA、QLoRA）、强化学习对齐（RLHF/DPO）或模型优化加速技术，并有成功落地经验。
4. 在ACM编程竞赛、Kaggle等顶级算法赛事中获得优异成绩。
任职要求：
基本条件：
1. 计算机科学、人工智能、机器学习等相关专业硕士及以上学历，3年以上算法研发经验；
2. 坚实的多模态大模型基础：深入理解CLIP、BLIP、LLaVA、Qwen-VL等模型的原理，并有相关实践，如有对图片、视频的理解、生成或编辑能力更加分；
3. 强烈的自驱力与好奇心：对探索AI技术边界充满热情，能主动追踪前沿并快速实验验证，具备优秀的学习能力和韧性。
优先条件：
1. 在多模态理解与生成、视觉-语言模型、自动驾驶大模型等相关领域，以第一作者在CVPR/ICCV/ECCV/NeurIPS/ICLR等顶会发表过论文；
2. 具备将多模态大模型应用于图片/视频生成/理解或复杂场景生成的实际项目经验，有地图相关项目经验者极具优势；
3. 熟悉大模型高效微调技术（如LoRA、QLoRA）、强化学习对齐（RLHF/DPO）或模型优化加速技术，并有成功落地经验。
4. 在ACM编程竞赛、Kaggle等顶级算法赛事中获得优异成绩。

高德 多模态大模型算法工程师/专家 图片/视频理解/模型训练方向-P7

Upload and Send CV

高德多模态大模型算法工程师/专家图片/视频理解/模型训练方向-P7