计算机视觉及多模态算法工程师

发布时间: 2025-07-16 01:07 工作地点: 北京 薪资: 40-70万

必备条件:
统招,35以下
优先条件:
大厂及知名AI公司
岗位职责:
任职要求:
1. 优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先
2. 具有优秀的基础算法、扎实的机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域的技术,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者优先
3. 熟悉QWenVL、LLava等多模态大模型的框架、预训练和微调等技术,有 MLLM、LLM、RAG、UI Agent方向的实际落地经验优先, 熟悉大模型训练、RL算法者优先;
4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题;
5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
任职要求:
岗位职责:
1. 负责多模态大模型的研发和应用,研究相关技术在智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力,研发以人工智能技术为核心的新技术、新产品;
2. 参与多模态大模型的结构设计、预训练任务、模型训练和推理等工作,包括但不限于多模态预训练、跨模态检索、多模态对话、RAG、UI Agent等;
3. 探索超大规模模型,进行极致系统优化, 参与数据建设、指令微调、偏好对齐、模型优化、原型系统搭建、大模型应用构建;
4. 结合电信业务和开源技术,对大模型的特定能力进行针对性优化, 在相关应用落地,包括视频解析布控系统、事件检索系统、智能助手、智能硬件等。

简历提交评估