岗位职责:
1. 基于计算设备编程框架,开发与主流深度学习框架兼容的算子
2. 基于计算设备底层软件栈,对主流深度学习框架进行适配开发
3. 分析主流深度学习框架在计算设备上的性能瓶颈,并进行性能优化
4. 主流大模型并行训练框架适配与优化
任职要求:
1. 熟悉掌握深度学习算法,能熟练地训练神经网络模型
2. 熟悉主流框架中的常用算子及其数学意义,有实现经验的优先
3. 熟悉主流深度学习框架,包括但不限于Pytorch、Tensorflow、Jax、PaddlePaddle、MindSpore等,对其中之一或多个的底层实现有较深入研究的优先
4. 熟悉并行训练框架,了解大模型训练或微调技术,有实际项目经验的优先
5. 熟悉CUDA、OpenCL等异构编程框架的优先;熟悉CUDA软件栈、oneAPI软件栈或ROCm软件栈的优先
6. 熟练掌握Python和C/C++,了解Python与C/C++相互调用方法;熟悉Linux,熟练掌握Shell
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29