大模型算法工程师(安全与攻击方向)
安全可信AI中心|全职|工程通道|上海
2025-12-18
岗位职责
1. 负责大模型及智能体安全评测的系统构建与算法落地,实现从环境构建、自动化攻击到安全校验的全流程工程化闭环;
2. 仿真环境集成与开发:负责高保真数字孪生环境的工程落地,集成端侧、具身、数字游戏等多种仿真环境,开发标准化的交互接口与数据采集模块,实现物理世界到虚拟环境的映射与同步;
3. 攻击工具链研发与集成:负责构建自动化攻击武器库,实现支持各类模态各类越狱攻击算法的工程化封装与集成,开发支持配置化的数据集包装器与流水线,并适配各类仿真环境;
4. 智能体系统平台实现:实现支持多种任务的单智能体及多智能体协同的框架,优化通信、协作与状态同步机制,确保大规模并发评测的高效运转;
5. 安全校验系统构建:负责多模态内容安全检测模型开发,完成相关数据采集、构造,支持事实性校验、实时风险阻断。
2. 仿真环境集成与开发:负责高保真数字孪生环境的工程落地,集成端侧、具身、数字游戏等多种仿真环境,开发标准化的交互接口与数据采集模块,实现物理世界到虚拟环境的映射与同步;
3. 攻击工具链研发与集成:负责构建自动化攻击武器库,实现支持各类模态各类越狱攻击算法的工程化封装与集成,开发支持配置化的数据集包装器与流水线,并适配各类仿真环境;
4. 智能体系统平台实现:实现支持多种任务的单智能体及多智能体协同的框架,优化通信、协作与状态同步机制,确保大规模并发评测的高效运转;
5. 安全校验系统构建:负责多模态内容安全检测模型开发,完成相关数据采集、构造,支持事实性校验、实时风险阻断。
岗位要求
1. 计算机、人工智能、数学等相关专业,硕士及以上学历,具备 3 年以上算法或模型相关经验(或具备同等能力)。
2. 深入理解 Transformer 架构与大模型训练流程,熟悉常见后训练方法(SFT、DPO、RLHF 等)。
3. 精通 Python / PyTorch,具备扎实的工程能力,熟悉分布式训练、模型加速与推理架构。
4. 在大模型微调、RAG/Agent、模型对齐、多模态等方向有项目经验者优先。有开源社区贡献或相关论文成果者加分。
5. 具备良好的沟通、协作与问题解决能力,能推动项目高质量落地。
2. 深入理解 Transformer 架构与大模型训练流程,熟悉常见后训练方法(SFT、DPO、RLHF 等)。
3. 精通 Python / PyTorch,具备扎实的工程能力,熟悉分布式训练、模型加速与推理架构。
4. 在大模型微调、RAG/Agent、模型对齐、多模态等方向有项目经验者优先。有开源社区贡献或相关论文成果者加分。
5. 具备良好的沟通、协作与问题解决能力,能推动项目高质量落地。


