Agent数据算法工程师 供给智能

发布时间: 2026-01-01 18:34 工作地点: 杭州 薪资: 24万-56万

工作职责:
1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 
2、重点探索模型后训练数据质量评估和清洗Pipeline的体系化构建,构建高质量路径级(CoA)训练数据的自动化校验和清洗方案; 
3、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答等方面的能力; 
4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点关注模型评测Benchmark、数据构建、Agent自动化评测等技术和应用方向; 
5、结合AI基建产品构建起人机协同的Agent训练数据质量和规模的持续提升优化技术能力,为各垂类Agent构建起高质量的训练数据池。
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 
2、具有大模型预训练数据构建Pipeline搭建经验者优先,具备路径级(CoA)数据采集与质量评估经验者优先; 
3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先; 
4、深入理解Transformer架构、SFT/RL训练范式及Prompt工程,有AI搜索系统或Agent记忆系统搭建经验者优先; 
5、能熟练使用各种大数据处理工具,能快速在大数据处理链路中集成各类算法模型能力调用,具备完整的离线大规模数据处理技能栈者优先。
任职要求:
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 
2、具有大模型预训练数据构建Pipeline搭建经验者优先,具备路径级(CoA)数据采集与质量评估经验者优先; 
3、精通Python及PyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先; 
4、深入理解Transformer架构、SFT/RL训练范式及Prompt工程,有AI搜索系统或Agent记忆系统搭建经验者优先; 
5、能熟练使用各种大数据处理工具,能快速在大数据处理链路中集成各类算法模型能力调用,具备完整的离线大规模数据处理技能栈者优先。

简历提交评估