1、参与深度学习框架研发工作,落地深度学习领域新方法和新实现,了解相关领域的新技术;
2、参与深度学习框架的研发与优化;
3、适配深度学习最新算法与架构,对框架进行调整、改进和优化;
4、对框架的训练速度进行优化,包括计算和通信及其调度,以提高模型训练的效率;
5、扩充深度学习框架的功能和计算能力,完善工具体系。
任职要求:
1、具有良好的编程习惯,熟练使用Python/C++ 语言,有较强的debug能力;
2、扎实的计算机科学功底和编程能力,熟练使用常见的算法和数据结构,良好的编程习惯和代码风格;
3、对深度学习框架或者深度学习编译器有较深理解以及实践经验(包含不限于深度学习框架:Pytorch,TF,JAX;大模型推理框架:vllm、LMDeploy、lightllm等;深度学习编译方向:triton,XLA,MLIR,TVM,Mojo等等);
3、熟悉大模型的训练或者推理算法;
4、有良好的文档习惯,及时按照要求撰写技术文档和工作进展;
5、有较强的团队精神和沟通交流能力。