必备条件:
GPU编译器相关,算法落地,算法工程化
优先条件:
天数,沐曦,燧原,摩尔,瀚博,寒武纪等芯片公司 的相关工作背景
岗位职责:
职位描述
1、负责深度学习模型的部署与优化,确保模型在目标硬件平台上的高效运行;
2、参与模型压缩、量化、剪枝等优化技术的研究与实现,提升模型在边缘设备上的推理效率;
3、与算法团队协作,将训练完成的模型封装为可部署的推理服务,支持多平台适配;
4、负责模型部署后的性能监控与调优,确保模型在不同硬件平台上的稳定性与一致性;
5、编写自动化部署脚本与测试用例,提升部署效率与自动化水平;
6、跟踪前沿技术,探索模型部署在边缘计算、嵌入式系统等场景下的应用潜力;
7、参与CUDA生态的底层算子开发与优化,提升模型在GPU平台上的推理性能;
8、与硬件团队协作,优化模型在异构计算平台(如GPU、NPU、DSP)上的部署方案;
任职要求:
职位要求
1、熟练掌握Python/C++编程语言,熟悉深度学习框架(如PyTorch、TensorFlow、ONNX等);
2、熟悉模型部署流程,包括模型导出、转换、优化、打包等;
3、熟悉模型压缩与优化技术,如量化、剪枝、蒸馏等;
4、熟悉主流推理引擎(如TensorRT、OpenVINO、ONNX Runtime等),具备推理加速经验者优先;
5、熟悉Linux系统开发与调试,具备脚本编写能力;
6、熟悉自动驾驶系统架构,了解模型在感知、决策、控制等模块中的应用;
7、熟悉CUDA生态,具备CUDA算子开发或优化经验者优先;
8、了解异构计算平台(如GPU、NPU、DSP)的部署与优化,有相关经验者优先;
9、熟悉典型自动驾驶/多模态模型结构,包括感知、决策、控制等模块的集成与部署。