工作职责:
1、主导多模态大模型(eg: deepseek、lama、qwen)的工程化落地,设计数据清洗-训练-推理全链路优化方案;
2、构建可复用的工程模块(如自动标注系统、场景仿真工具、测评平台),支持算法快速迭代;
3、攻坚大模型系统优化技术(模型压缩、硬件加速),让大模型能顺利落地各个业务场景;
1、计算机相关专业,5年以上Java/python/c++开发经验;
2、熟练掌握Transformer架构及其优化技术
3、精通PyTorch/TensorFlow框架,具备CUDA级性能调优经验;
4、熟悉大模型全流程工具链(如Hugging Face);
5、具备多模态数据处理能力(文本/图像/语音)
6、理解垂直领域需求(eg 对话机器人),能将生成式模型与业务逻辑结合,有企业级落地经验优先;
7、有一定英语读写能力,能无障碍阅读大模型相关paper的优先
任职要求:
1、计算机相关专业,5年以上Java/python/c++开发经验;
2、熟练掌握Transformer架构及其优化技术
3、精通PyTorch/TensorFlow框架,具备CUDA级性能调优经验;
4、熟悉大模型全流程工具链(如Hugging Face);
5、具备多模态数据处理能力(文本/图像/语音)
6、理解垂直领域需求(eg 对话机器人),能将生成式模型与业务逻辑结合,有企业级落地经验优先;
7、有一定英语读写能力,能无障碍阅读大模型相关paper的优先