大模型算法专家

发布时间: 2025-08-23 02:06 工作地点: 深圳 薪资: 50-100万

必备条件:
1 人工智能、计算机、电子、数学等相关专业毕业,具备扎实的数据结构与算法基础,具备良好的数学思维能力; 2 熟悉有关Transfomer、BERT、GPT、MoE等方面的知识,对Llama,DeepSeek等大模型框架与其在业务应用、效率提升方面的实践有相关经历; 3 熟悉常用大模型*方法,包括PEFT、RLHF等相关技术; 4 熟悉常用数据挖掘算法及其应用,掌握机器学习算法(如LR、GBDT、XGBoost、RL、DNN等),并具备实战经验; 5 优秀的代码能力、数据结构和基础算法功底,熟悉一种深度学习框架(Pytorch,TensorFlow)和linux,并熟练掌握C++、Java、Python或Golang等语言之一; 6 具备优秀的算法设计和实现能力,能够独立完成算法等需求分析、方案设计、代码实现和效果评估; 7 热衷于了解业界前沿技术,洞悉人工智能国际会议的研究动态,具有强烈的钻研精神和主观能动性,能够适应快速变化的技术趋势。
优先条件:
一二线互联网公司
岗位职责:
职位描述
负责基于大模型的智能金融构建,包括但不限于利用prompt、sft、rlhf、agent等技术,探索大模型在金融业务场景下的解决方案,擅长发现优化大模型的简单、普适的想法,并应用到各个规模模型及业务场景中提升效果,拓展模型的应用范围.
1、大模型全链路研发,提升逻辑推理、任务规划等核心认知能力
2、提升模型工具调用、api 交互能力,使其具备构建agent、multi-agent解决复杂问题的能力
4、探索大模型在金融业务场景下的解决方案,擅长发现优化大模型的简单、普适的想法,并应用到各个规模模型及业务场景中提升效果,拓展模型的应用范围
5、密切关注行业的最新动态,跟踪研究最新技术和趋势,推进有价值的技术在公司内部落地,探索前沿的算法迭代,推动技术创新
6、构建大模型文本处理任务的评测体系,涵盖准确率、流畅度、逻辑一致性等维度
7、具备论文复现能力,在顶刊发表过相关领域学术文章者优先,顶刊包括但不限于 nlp 领域的 acl、emnlp,语音领域的interspeech,以及 neurips、icml、iclr 等
8、与工程团队紧密合作,推动模型的工程化部署,包括模型压缩、推理加速等环节.
任职要求:
核心要求:sft和rlhf是基本要求.
还需要大模型算法优化,多agent协同,工具调用训练.
训练agent正确使用工具,如何使用工具,思考和反省.
职位要求
1 人工智能、计算机、电子、数学等相关专业毕业,具备扎实的数据结构与算法基础,具备良好的数学思维能力
2 熟悉有关transfomer、bert、gpt、moe等方面的知识,对llama,deepseek等大模型框架与其在业务应用、效率提升方面的实践有相关经历
3 熟悉常用大模型post-training方法,包括peft、rlhf等相关技术
4 熟悉常用数据挖掘算法及其应用,掌握机器学习算法(如lr、gbdt、xgboost、rl、dnn等),并具备实战经验
5 优秀的代码能力、数据结构和基础算法功底,熟悉一种深度学习框架(pytorch,tensorflow)和linux,并熟练掌握c++、java、python或golang等语言之一
6 具备优秀的算法设计和实现能力,能够独立完成算法等需求分析、方案设计、代码实现和效果评估
7 热衷于了解业界前沿技术,洞悉人工智能国际会议的研究动态,具有强烈的钻研精神和主观能动性,能够适应快速变化的技术趋势.

简历提交评估