负责面向应用场景的大模型技术研究和模型迭代,具体包括:
1. 研究大模型应用的关键技术,包括:模型后训练、高效数据管线搭建、结合 RAG/Agent 框架的决策与推理等;
2. 负责垂直领域模型的训练工作,包括:需求分析、数据集构建、模型训练、评估及优化等;
3. 参与实验室产研合作项目,推进大模型前沿技术的在重要产业领域落地。
任职要求:
1. 本科及以上学历,计算机科学、人工智能相关专业优先;
2. 了解大模型的底层原理、主流训练/部署框架和主要应用场景,能跟踪大模型领域的最新技术动向;
3. 具有扎实的编程基础,熟悉 Python/PyTorch,有优秀的工程能力;
4. 具有大模型训练(SFT、PEFT、RLHF 等)经验者优先;
5. 了解 RAG/Agent/Prompt Optimization 技术原理和开源框架,有相关项目经验者优先;
6. 在 NLP/CV/DL/ML 等领域发表过学术论文,或参与过优秀开源项目开发维护者优先。