工作职责:
1. 跟进LLM / VLM大模型的最新技术动态,围绕Reasoning技术(如思维链、多步推理)、Long Context技术、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地;
2. 面向垂直场景打造 LLM / VLM 应用体系,构建端到端数据链路,建立高稳定、低幻觉的模型交付框架,以极致的智能交互体验重塑用户在未来世界的生活与沟通方式。
1. 硕士及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;
2. 精通 PyTorch / TensorFlow 等主流框架,拥有 GPT、LLaMA 等超大规模语言模型的训练、微调与性能优化一线经验;
3. 具备扎实的计算机视觉与机器学习功底,深度掌握 CV、AIGC、NLP、RL 等前沿技术,在 CVPR / ECCV / ICCV / NeurIPS / ICLR / SIGGRAPH / SIGGRAPH Asia 等顶级会议发表论文者优先;
4. 具备出色的问题拆解与解决能力,能深入定位并攻克大模型训练及落地过程中的关键难题,拥有独立探索创新方案的能力。
任职要求:
1. 硕士及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;
2. 精通 PyTorch / TensorFlow 等主流框架,拥有 GPT、LLaMA 等超大规模语言模型的训练、微调与性能优化一线经验;
3. 具备扎实的计算机视觉与机器学习功底,深度掌握 CV、AIGC、NLP、RL 等前沿技术,在 CVPR / ECCV / ICCV / NeurIPS / ICLR / SIGGRAPH / SIGGRAPH Asia 等顶级会议发表论文者优先;
4. 具备出色的问题拆解与解决能力,能深入定位并攻克大模型训练及落地过程中的关键难题,拥有独立探索创新方案的能力。