科研动态

Dynamics

首页 >  科研动态 > 新闻  >  详情

上海AI实验室 ICCV 2023 Tutorial|活动预告

       2023年度计算机视觉国际大会(International Conference on Computer Vision, ICCV)召开在即,上海人工智能实验室(上海AI实验室)将举办ICCV Tutorial研讨会,以OpenMMLab: Open-source Platform for Vision, Language and Generative AI为主题,诚邀人工智能领域研究者共话AI领域开源的变革与趋势,共同探讨AI开源算法与数据平台等相关课题。

       ICCV是计算机领域世界顶级的学术会议之一,与CVPR、ECCV并称计算机视觉三大顶会,每两年举办一次。会议上将颁发最佳论文奖(Marr Prize)和最佳论文提名奖。本届会议将于10月2日至6日在法国巴黎举行。

       今年7月,ICCV公布本届大会论文收录结果,共计2160篇论文入选。在开源社区HuggingFace已展示的1142篇入选论文中,50篇论文涉及的研究成果基于OpenMMLab系算法库产生。

 

活动时间

UTC+8 中国:15:00 - 17:45(10月2日)

UTC+2 法国:09:00 - 11:45(10月2日)

 

活动地址

Paris Convention Center, @Room P02 | Paris, France

 

活动详情

https://openmmlab.com/community/iccv2023-tutorial(点击文末阅读原文直达)

 

分享主题

Talk 1:OpenMMLab:视觉、语言与生成式人工智能开源平台

 

638315395837750000.jpg


   

   Kai Chen

   上海AI实验室

   青年科学家

  


所负责的OpenMMLab开源项目在GitHub上获得了超过9.2万个星标,是深度学习时代极具影响力的计算机视觉开源算法体系,用户遍及110个国家和地区, 获国内600余家企业和高校使用,在学术界和工业界产生了广泛影响。在计算机视觉顶级会议和期刊上发表了三十余篇论文,谷歌学术引用超过8000次,并多次在国际学术竞赛中获奖。

 

分享内容

第一部分:OpenMMLab总体介绍,包括整体架构、模块设计及其影响力。

第二部分:工具箱的基本使用,包括训练和模型部署,以及运用 OpenMMLab 进行研究和生产的实践。

第三部分:书生·浦语(InternLM)开源体系介绍。

 

Talk 2:OpenMMLab基础模型研究进展

 

  638315404357550000.jpg


  Songyang Zhang

  上海AI实验室

  青年研究员

 


在基础模型相关方向开展的算法研究和开源平台建设,带领团队开发并维护了OpenMMLab中的多模态算法库MMPreTrain、以及大模型评测平台OpenCompass。在计算机视觉领域的顶级会议和期刊上发表了约20篇论文,谷歌学术论文引用1000余次。

 

分享内容

将分享视觉基础模型与多模态模型的最新进展,并介绍相关的开源算法库。内容分为以下四个部分:

第一部分:深度学习基础模型库(MMPreTrain)。将展示该基础模型发展的里程碑工作,并详细展示该模型库的整体设计和特点。

第二部分:多模态学习的最新进展。本部分将首先介绍多模态学习的社区进展,并分享如何使用MMPreTrain进行多模态学习。

第三部分:使用基础模型进行图像分类和自监督学习实践,并展示如何使用MMPreTrain来进行图像分类任务和自监督学习。

第四部分:介绍如何使用OpenCompass开展基础模型的评测与分析工作(包括视觉模型、大语言模型和多模态模型)。

 

Talk 3:MMDetection:从通用目标检测迈向多模态智能体

 

638315400928090000.jpg


  

  Wenwei Zhang

  上海AI实验室

  青年研究员

 


负责OpenMMLab计算机视觉算法开放体系中算法库基础架构的整体设计、MMDetection和MMDetection3D等算法库的设计与开发。在顶级会议和期刊上发表论文约20篇,曾2019年目标检测领域权威学术竞赛COCO 比赛第一名,2020年3D目标检测领域权威竞赛nuScenes比赛 Best PKL Award。

 

分享内容

高效运用MMDetection 3.0进行与目标检测相关的研究项目。

第一部分:目标检测、实例分割和全景分割。深入探讨上述领域的问题定义、挑战和代表性方法,展现目标检测全景。

第二部分:MMDetection,即OpenMMLab检测工具箱和基准测试、目标检测中最受欢迎的工具箱之一,也是MMDetection3D和MMTracking等许多工具箱的基础。深入讲解MMDetection 3.0的模块化设计和模型库。

第三部分:智能体工具箱Lagent,该工具箱实现了基于大语言模型的智能体系统,能够支持大语言模型调用MMDetection提供的目标检测器。本部分将介绍Lagent的简洁设计以及它如何使用目标检测器完成多模态智能体的任务。

 

Talk 4:MMagic —— 图像与视频生成、编辑及增强工具库

 

638315402959600000.jpg


  Yanhong Zeng

  上海AI实验室

  青年研究员

 


研究方向为图像和视频的生成与编辑,在顶级国际学术期刊与会议上发表多篇论文,包括CVPR/ECCV/NeurIPS/TVCG,同时担任多个国际顶级会议和期刊的审稿人,包括ICML/ICLR/NeurIPS/CVPR/TIP/TVCG等。

 

分享内容

前沿开源工具箱MMagic及图像与视频生成、编辑和增强领域的先进研究成果。

第一部分:介绍图像和视频生成、编辑和增强任务。分享该领域中经典和主流任务、挑战以及最新研究成果。

第二部分:将从整体设计和实现的角度介绍MMagic开源工具箱。MMagic支持图像及视频生成、编辑和增强领域的各种任务(如图像超分辨率、文本到图像等)和模型(如GAN、扩散模型等),为相关任务提供了统一灵活的解决方案。

第三部分:将介绍如何使用MMagic快速运行预训练模型,以及如何为不同任务设计全新模型。

 

Talk 5: OpenDataLab —— 一个面向人工智能的开放数据平台

 

638315393083820000.jpg


  

  Bin Wang

  上海AI实验室

  青年研究员



带领算法团队进行多模态大模型数据相关的算法研究,曾于ICCV、MICCAI和IJCAI等学术顶会上发表系列论文并在多个国际赛事中获得奖项。代表工作有 《V3Det: Vast Vocabulary Visual Detection Dataset》 (ICCV 2023)、《Boundary perception guidance: A scribble-supervised semantic segmentation approach》(IJCAI 2019)。

 

分享内容

第一部分:OpenDataLab整体介绍,包括开放数据集平台、开源数据处理工具箱和数据集描述语言(DSDL)。

第二部分:OpenDataLab支持的开源数据工具包相关研究工作。

第三部分:探索定义数据集描述语言以及如何使用它来规范不同任务、格式和模态的数据集。

 

诚邀相关领域研究者参与研讨会,填写下方的问卷获取更多参会信息。

638315403737590000.jpg

 



comm@pjlab.org.cn

上海市徐汇区云锦路701号西岸国际人工智能中心37-38层

沪ICP备2021009351号-1