上海招聘 AI芯片模型部署专家 -

必备条件:
AI芯片模型部署专家
优先条件:
AI芯片类公司（最好是GPU芯片）
岗位职责:
岗位职责：
1、结合自研AI芯片特性，研究模型在自研AI芯片上部署、压缩，输出系统级方案；
2、分析典型模型结构的计算、访存特性，探索能够极致发挥自研AI芯片算力的模型结构，以及压缩部署方案，并应用于具体的产品；
3、系统性思考AI芯片模型部署压缩问题，将分析和优化经验工具化；
4、参与AI算子库的开发和优化，支撑算法模型推理所需算子的功能和基本性能要求，分析性能瓶颈，构建方案优化；
5、负责自研AI加速芯片系统软件栈的开发交付，包括芯片设备侧Firmware/Host侧驱动/系统管理诊断工具；
任职要求:
职位要求
任职要求:
1、至少5年以上AI芯片以及GPGPU芯片或者相关领域的工作经验；
2、熟悉CUDA Runtime/Driver API/NCCL/CUPTI等，熟悉CUDA Toolkit软件栈；
3、熟悉计算机体系架构，对深度学习有深入的理解，熟悉并行/异构计算体系结构，有在GPU/NPU/TPU/ARM/X86/DSP等任意平台上的开发和优化经验，理解其微架构、主要指令集等；
4、深入理解AI大模型训推原理，精通至少一种深度学习框架，如TensorFlow或PyTorch；理解LLM网络模型结构，熟悉模型部署、分析和优化；
5、对典型任务场景、典型模型结构的设计原理有深刻理解。能够深入分析模型计算、访存特性并应用于模型性能优化过程中；
6、有GPGPU/NPU Firmware/Linux驱动开发经验，对内存管理、Kernel任务调度、RAS等有实际开发调试经验；

AI芯片模型部署专家

简历提交评估