岗位职责:
1. 参与百亿+参数量的大模型(语言与多模态)在人工智能领域(语言生成、机器人控制等)研发的全流程工作;
2.在大模型方向的基础网络架构、训练优化算法、效率及稳定性提升、数据集建设等方面持续优化迭代;
3.紧跟**技术进展,与学术界紧密合作,参与关键创新、突破与积累(专利、论文等)。
任职要求:
1.博士学历优先,计算机、人工智能、软件等相关专业,4年以上(博士2年以上) AI领域工作经验;
2. 具备扎实的 Python、C/C++开发功底,熟练掌握pytorch/tensorflow 等主流 DL框架;掌握规范 git 工作流、敏捷开发能力、代码提效工具者优先;
3. 熟悉 SOTA 的模型架构与训练方法,如多模态模型、自监督学习、迁移学习等
4. 有大模型搭建、多模态模型开发全流程(数据采标清洗、模型设计调优、性能评测诊断等)、分布式训练及部署等经验者优先;
5.熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT;
6. 有大模型、机器人、自动驾驶、无人机等方向开源项目维护/贡献经历或相关方向高水平论文发表者优先;
7. 有创新的想法,乐于接受技术挑战,具备一定的英文读写能力、较好的沟通能力、良好的团队合作能力。
更新时间: 2024/08/13
更新时间: 2024/08/13
更新时间: 2024/08/12
更新时间: 2024/08/12
更新时间: 2024/08/12