岗位职责:
1. 带领团队开展大模型算法研究,包括但不限于:NLP/CV单模态、多模态大模型的预训练,全参、LoRA、P-Tuning等模型微调,模型量化、分布式部署算法,实现大模型算法研究与应用;
2. 带领团队解决大模型推理效率低的问题,解决大模型业务落地的技术障碍;
3. 协同跨团队技术和业务团队共同达成技术和业务目标;
4. 负责跟踪**新的技术发展和研究成果,提出新的技术创新和改进方案,以提高模型的性能和效率;
5. 提供独立思考和创新能力,解决不同领域大模型的技术难题。
6. 基于国际开源及国内生态伙伴的大模型技术方案,探索落地汽车行业各业务的大模型技术及开发方案。
任职要求:
1. 计算机、数学或统计学相关专业;
2. 优秀的Python/C++编程能力,熟练掌握Pytorch,Tensorflow、PaddlePaddle等至少一种深度学习框架,对主流大模型(例如GPTx/chatGPT/T5/PaLM/LLaMA/GLM等)的原理、性能、差异有深入理解;
3. 熟悉大模型分布式训练技术和加速库,如Megatron、DeepSpeed、PaddleFleetX等;
4. 掌握大模型生产全链路技术,拥有大模型训练、微调、评估、优化及产品应用经验;
5. 熟悉常见的模型压缩技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT;
6. 作风踏实严谨、责任心强,思路清晰、思维敏捷、学习能力强,善于解决复杂问题;
7. 具备良好的沟通能力、自我驱动,具有团队合作、带队经验。
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29