岗位职责:
1、负责自然语言处理 (NLP) 大模型的算法研究和开发;
2、根据业务场景需求设计微调方案、适配算法和调优工程方案;
3、负责大模型的微调算法的开发和优化;
4、应用场景包括文本摘要、文本生成、机器阅读理解、问答、多轮对话等。
任职要求:
1. 计算机相关专业获得硕士学位, 博士优先, 发表过大模型相关研究AI顶会论文优先;
2. 对NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等的原理和差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;
4. 熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT;
5. 有良好的代码开发能力,有开源项目开发经验优先。
更新时间: 2024/08/13
更新时间: 2024/08/13
更新时间: 2024/08/12
更新时间: 2024/08/12
更新时间: 2024/08/12