大模型算法工程师-模型架构与学习范式方向

大模型中心|全职|工程通道|上海

2025-09-23

岗位职责
1、参与大模型前沿架构研究、算法验证、工程实现的全流程。
2、参与大模型学习与训练范式、特别是大规模预训练范式的算法验证、工程实现。
3、调优前沿架构的算法细节,优化突破Transformer、涉及多种模态的新架构模型的工程实现。
4、开发适用于架构与训练范式高效算法验证的工具链和内部算法库。
岗位要求
1、硕士及以上学历,计算机或人工智能相关专业优先,有顶会论文可加分。
2、熟悉主流大模型的部署、训练、架构实现,有大规模训练和部署经验者优先。
3、熟悉模型架构和训练范式研发工作者优先。
4、熟悉deepspeed、xtuner、llamafactory、megatron、vllm、sglang、lmdeploy、opencompass等大模型训练、推理、训练框架可加分。
5、具备良好的沟通表达能力、团队协作意识、针对关键技术难度的攻坚能力以及一定的抗压能力。

上海市徐汇区龙文路129号
国际传媒港L1楼

联系我们
comm@pjlab.org.cn