1. 设计和开发基于人类反馈的强化学习系统,优化其性能、可靠性和可扩展性
2. 探索多智能体协作,记忆,环境互动的创新方法,构建原型并进行评测和改进
3. 与算法专家、领域专家合作,识别问题和需求并将其转换为技术方案
4. 优化和维护现有的系统并实现新的功能,支持业务需求
职位要求
1. 拥有计算机科学或相关领域的硕士或博士学位
2. 熟悉至少一种编程语言,有较强的分析和解决问题的能力
3. 对创新充满热情,能跟上AI领域的最新进展
4. 优先考虑熟悉微调技术, 训练或推理系统,智能体技术的候选人
5. 优先考虑在计算机系统领域的顶级会议和期刊发表过发表过论文的候选人