1. 参与大模型预训练数据相关的提取、清洗工具和模型开发2. 利用自研、开源数据提取工具提取和加工PB级数据集3. 不断提升流水线自动化、标准化、可观测性水平岗位要求:1. 强烈的责任心和自驱力,具有完美主义情节2. 计算机及相关专业统招本科及以上学历,工作经验3年及以上3. 熟练使用shell、python、spark,思维严密,注重质量4. 如有优秀个人软件作品可放宽工作年限
comm@pjlab.org.cn
上海市徐汇区龙文路129号国际传媒港L1楼
沪ICP备2021009351号-1