必备条件:
AI芯片模型部署专家
优先条件:
AI芯片类公司(最好是GPU芯片)
岗位职责:
岗位职责:
1、结合自研AI芯片特性,研究模型在自研AI芯片上部署、压缩,输出系统级方案;
2、分析典型模型结构的计算、访存特性,探索能够极致发挥自研AI芯片算力的模型结构,以及压缩部署方案,并应用于具体的产品;
3、系统性思考AI芯片模型部署压缩问题,将分析和优化经验工具化;
4、参与AI算子库的开发和优化,支撑算法模型推理所需算子的功能和基本性能要求,分析性能瓶颈,构建方案优化;
5、负责自研AI加速芯片系统软件栈的开发交付,包括芯片设备侧Firmware/Host侧驱动/系统管理诊断工具;
任职要求:
职位要求
任职要求:
1、至少5年以上AI芯片以及GPGPU芯片或者相关领域的工作经验;
2、熟悉CUDA Runtime/Driver API/NCCL/CUPTI等,熟悉CUDA Toolkit软件栈;
3、熟悉计算机体系架构,对深度学习有深入的理解,熟悉并行/异构计算体系结构,有在GPU/NPU/TPU/ARM/X86/DSP等任意平台上的开发和优化经验,理解其微架构、主要指令集等;
4、深入理解AI大模型训推原理,精通至少一种深度学习框架,如TensorFlow或PyTorch;理解LLM网络模型结构,熟悉模型部署、分析和优化;
5、对典型任务场景、典型模型结构的设计原理有深刻理解。能够深入分析模型计算、访存特性并应用于模型性能优化过程中;
6、有GPGPU/NPU Firmware/Linux驱动开发经验,对内存管理、Kernel任务调度、RAS等有实际开发调试经验;