大模型算法工程师/青年研究员

大模型中心

发布时间:2025-03-19

上海

职位描述

职位描述:
1、架构设计与优化:
-研究大模型(包括大语言模型和多模态大模型)的架构设计与优化技术,涵盖模型结构创新、计算效率优化、分布式训练、推理加速等方向;
-探索大模型架构的前沿技术,如稀疏化、模块化、动态推理、混合精度训练以及Diffusion特性等,提升模型的性能与泛化能力。
2、框架开发与优化:
-构建高效的大模型训练与推理框架,解决大规模模型在计算资源、内存占用、通信开销等方面的挑战;
-优化现有框架的性能,提升训练速度、降低推理延迟,并支持更大规模的模型部署。
3、前沿研究与技术影响力:
-持续关注大模型架构领域的最新研究动向,推动技术创新;
-在顶级会议及期刊(如 NeurIPS、ICML、CVPR、ACL 等)上发表高水平论文,提升团队和行业的技术影响力。
4、实际应用与落地:
-与团队合作,将大模型架构研究成果应用于实际业务场景,推动技术落地;
-解决业务中的关键技术难题,提升产品的核心竞争力。

职位要求:
1、学历要求:
-硕士及以上学历,专业方向为计算机科学、人工智能、机器学习、自然语言处理、计算机视觉等,博士优先;
2、技术能力:
-熟练掌握 Python 和深度学习框架,熟悉 Transformers 等常用工具;
-熟悉大模型架构设计与优化技术,如Diffusion优化、稀疏注意力、混合精度训练、分布式训练、模型压缩等;
-具备扎实的算法与数据结构基础,熟悉大规模数据处理与高性能计算;
3、经验要求:
-三年以上大模型架构研究或相关领域工作经验优先;
-有顶级会议论文发表经验(如 NeurIPS、ICML、CVPR、ACL 等)者优先;
-有一线互联网公司或知名研究机构大模型研发经验者优先;
4、软技能:
-具备良好的沟通表达能力、团队协作意识;
-具备关键技术难题的攻坚能力,以及一定的抗压能力;
-对技术有热情,具备较强的学习能力和创新精神。

社招最新职位