工作职责:
1. 负责基于大语言模型的代码大模型产品技术研发,打造具备代码生成、代码问答等功能的智能化产品应用
2. 推动上述技术在公司落地应用,并基于此探索新技术、新产品应用形态
3. 跟踪国内外**代码生成相关进展,持续改进和优化现有模型,为研发提效
任职资格:
1. 硕士及以上学历,5年以上算法工程化开发经验,计算机、电子信息等相关专业
2. 熟悉国内外主流代码开源大模型(codellama、starcoder等)基本原理,对大模型的训练、评估、优化以及微调具备实际落地经验
3. 精通python语言开发,熟悉NumPy,Pandas,Matplotlib,scikit-learn,Keras常用库
4. 熟练掌握Pytorch,Tensorflow、PaddlePaddle等至少一种深度学习框架
5. 熟悉大模型分布式训练技术和加速库,如Megatron、DeepSpeed
6. 熟悉大模型并拥有相关部署经验者优先
7. 具备开源社区贡献经验,如开源项目的代码贡献、Issue讨论、代码审查等经验者优先
8. 参与过知名大模型开源项目,善于利用业界优质模型从0到1推动技术落地者优先
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29
更新时间: 2024/09/29