Agent应用算法工程师 供给智能

发布时间: 2026-01-01 18:27 工作地点: 杭州 薪资: 24万-56万

工作职责:
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 
2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答等方面的能力; 
3、构建Agent RL所需的环境、训练方法,设计合理的Reward Function和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的Agent优化方案;
4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI搜索等方向的应用创新; 
5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率。
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 
2、熟悉MoE模型架构设计和原理,具有MoE模型预训练或者强化学习训练实操经验者优先; 
3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先; 
4、深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解LangChain、AutoGen等Agent开发框架,有完整智能体系统搭建经验者优先; 
5、熟悉常用的RL训练框架和训练技巧,有Verl、ROLL等强化学习训练框架使用经验者优先。
任职要求:
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 
2、熟悉MoE模型架构设计和原理,具有MoE模型预训练或者强化学习训练实操经验者优先; 
3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先; 
4、深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解LangChain、AutoGen等Agent开发框架,有完整智能体系统搭建经验者优先; 
5、熟悉常用的RL训练框架和训练技巧,有Verl、ROLL等强化学习训练框架使用经验者优先。

简历提交评估