工作职责:
1.参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。
2.结合大语言模型(LM)与强化学习(RL)技术,设计并实现推索推荐领域的生成式模型,结合业务开发A1 Agent的导购产品,助力流量效率和用户决策效率的全面提升。
3.持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。
1.计算机、数学、统计、自动化等相关专业硕士及以上学历,3年以上深度学习算法研究与开发经验,具备LLM&RL开发和实际落地经验
2.熟悉并实践pre-Treining/post-Training流程,了解业界各大公司的模型结构及训练方式(KmiK1.5DeepSeKR1),在LM&NLP领妹拥有相关从业经验,包括但不限于LM训练(CPT、SFT)
3.在RL领娥拥有相关从业经验,包括LLM结合的方法,RM、PPO、DPO、ORPO、GRP0等,也可以在其他领域内的方法,MBRL,DDPG,DDQN等。
4.扎实的机器学习、深度学习与自然语言处理理论基础,熟恶主流的BERT/Transformer/VIT/CLIP等预训练模型。
5.具备较强的编程与算法实现能力,拥有Python开发经验,精通PyTorch等深度学习框架。
6.具备优秀的逻辑思维能力、问题分析与解决能力,自驱力强,且具备出色的业务结果导向能力。
任职要求:
1.计算机、数学、统计、自动化等相关专业硕士及以上学历,3年以上深度学习算法研究与开发经验,具备LLM&RL开发和实际落地经验
2.熟悉并实践pre-Treining/post-Training流程,了解业界各大公司的模型结构及训练方式(KmiK1.5DeepSeKR1),在LM&NLP领妹拥有相关从业经验,包括但不限于LM训练(CPT、SFT)
3.在RL领娥拥有相关从业经验,包括LLM结合的方法,RM、PPO、DPO、ORPO、GRP0等,也可以在其他领域内的方法,MBRL,DDPG,DDQN等。
4.扎实的机器学习、深度学习与自然语言处理理论基础,熟恶主流的BERT/Transformer/VIT/CLIP等预训练模型。
5.具备较强的编程与算法实现能力,拥有Python开发经验,精通PyTorch等深度学习框架。
6.具备优秀的逻辑思维能力、问题分析与解决能力,自驱力强,且具备出色的业务结果导向能力。