上海AI实验室 ICCV 2023 Tutorial｜活动预告

来源：上海人工智能实验室｜2023-09-29

2023年度计算机视觉国际大会（International Conference on Computer Vision, ICCV）召开在即，上海人工智能实验室（上海AI实验室）将举办ICCV Tutorial研讨会，以OpenMMLab: Open-source Platform for Vision, Language and Generative AI为主题，诚邀人工智能领域研究者共话AI领域开源的变革与趋势，共同探讨AI开源算法与数据平台等相关课题。

ICCV是计算机领域世界顶级的学术会议之一，与CVPR、ECCV并称计算机视觉三大顶会，每两年举办一次。会议上将颁发最佳论文奖（Marr Prize）和最佳论文提名奖。本届会议将于10月2日至6日在法国巴黎举行。

今年7月，ICCV公布本届大会论文收录结果，共计2160篇论文入选。在开源社区HuggingFace已展示的1142篇入选论文中，50篇论文涉及的研究成果基于OpenMMLab系算法库产生。

活动时间

UTC+8 中国：15:00 - 17:45（10月2日）

UTC+2 法国：09:00 - 11:45（10月2日）

活动地址

Paris Convention Center, @Room P02 | Paris, France

活动详情

https://openmmlab.com/community/iccv2023-tutorial（点击文末阅读原文直达）

分享主题

Talk 1：OpenMMLab：视觉、语言与生成式人工智能开源平台

Kai Chen

上海AI实验室

青年科学家

所负责的OpenMMLab开源项目在GitHub上获得了超过9.2万个星标，是深度学习时代极具影响力的计算机视觉开源算法体系，用户遍及110个国家和地区，获国内600余家企业和高校使用，在学术界和工业界产生了广泛影响。在计算机视觉顶级会议和期刊上发表了三十余篇论文，谷歌学术引用超过8000次，并多次在国际学术竞赛中获奖。

分享内容

第一部分：OpenMMLab总体介绍，包括整体架构、模块设计及其影响力。

第二部分：工具箱的基本使用，包括训练和模型部署，以及运用 OpenMMLab 进行研究和生产的实践。

第三部分：书生·浦语（InternLM）开源体系介绍。

Talk 2：OpenMMLab基础模型研究进展

Songyang Zhang

上海AI实验室

青年研究员

在基础模型相关方向开展的算法研究和开源平台建设，带领团队开发并维护了OpenMMLab中的多模态算法库MMPreTrain、以及大模型评测平台OpenCompass。在计算机视觉领域的顶级会议和期刊上发表了约20篇论文，谷歌学术论文引用1000余次。

分享内容

将分享视觉基础模型与多模态模型的最新进展，并介绍相关的开源算法库。内容分为以下四个部分：

第一部分：深度学习基础模型库（MMPreTrain）。将展示该基础模型发展的里程碑工作，并详细展示该模型库的整体设计和特点。

第二部分：多模态学习的最新进展。本部分将首先介绍多模态学习的社区进展，并分享如何使用MMPreTrain进行多模态学习。

第三部分：使用基础模型进行图像分类和自监督学习实践，并展示如何使用MMPreTrain来进行图像分类任务和自监督学习。

第四部分：介绍如何使用OpenCompass开展基础模型的评测与分析工作（包括视觉模型、大语言模型和多模态模型）。

Talk 3：MMDetection：从通用目标检测迈向多模态智能体

Wenwei Zhang

上海AI实验室

青年研究员

负责OpenMMLab计算机视觉算法开放体系中算法库基础架构的整体设计、MMDetection和MMDetection3D等算法库的设计与开发。在顶级会议和期刊上发表论文约20篇，曾2019年目标检测领域权威学术竞赛COCO 比赛第一名，2020年3D目标检测领域权威竞赛nuScenes比赛 Best PKL Award。

分享内容

高效运用MMDetection 3.0进行与目标检测相关的研究项目。

第一部分：目标检测、实例分割和全景分割。深入探讨上述领域的问题定义、挑战和代表性方法，展现目标检测全景。

第二部分：MMDetection，即OpenMMLab检测工具箱和基准测试、目标检测中最受欢迎的工具箱之一，也是MMDetection3D和MMTracking等许多工具箱的基础。深入讲解MMDetection 3.0的模块化设计和模型库。

第三部分：智能体工具箱Lagent，该工具箱实现了基于大语言模型的智能体系统，能够支持大语言模型调用MMDetection提供的目标检测器。本部分将介绍Lagent的简洁设计以及它如何使用目标检测器完成多模态智能体的任务。

Talk 4：MMagic —— 图像与视频生成、编辑及增强工具库

Yanhong Zeng

上海AI实验室

青年研究员

研究方向为图像和视频的生成与编辑，在顶级国际学术期刊与会议上发表多篇论文，包括CVPR/ECCV/NeurIPS/TVCG，同时担任多个国际顶级会议和期刊的审稿人，包括ICML/ICLR/NeurIPS/CVPR/TIP/TVCG等。

分享内容

前沿开源工具箱MMagic及图像与视频生成、编辑和增强领域的先进研究成果。

第一部分：介绍图像和视频生成、编辑和增强任务。分享该领域中经典和主流任务、挑战以及最新研究成果。

第二部分：将从整体设计和实现的角度介绍MMagic开源工具箱。MMagic支持图像及视频生成、编辑和增强领域的各种任务（如图像超分辨率、文本到图像等）和模型（如GAN、扩散模型等），为相关任务提供了统一灵活的解决方案。

第三部分：将介绍如何使用MMagic快速运行预训练模型，以及如何为不同任务设计全新模型。

Talk 5: OpenDataLab —— 一个面向人工智能的开放数据平台

Bin Wang

上海AI实验室

青年研究员

带领算法团队进行多模态大模型数据相关的算法研究，曾于ICCV、MICCAI和IJCAI等学术顶会上发表系列论文并在多个国际赛事中获得奖项。代表工作有《V3Det: Vast Vocabulary Visual Detection Dataset》 (ICCV 2023)、《Boundary perception guidance: A scribble-supervised semantic segmentation approach》(IJCAI 2019)。

分享内容

第一部分：OpenDataLab整体介绍，包括开放数据集平台、开源数据处理工具箱和数据集描述语言（DSDL）。

第二部分：OpenDataLab支持的开源数据工具包相关研究工作。

第三部分：探索定义数据集描述语言以及如何使用它来规范不同任务、格式和模态的数据集。

诚邀相关领域研究者参与研讨会，填写下方的问卷获取更多参会信息。

${ v.newstitle }

${ v.newstitle }

新闻动态

科研活动

${ v.newstitle }

${ v.newstitle }

人才招聘

招生信息

${ v.newstitle }

上海AI实验室 ICCV 2023 Tutorial｜活动预告

来源：上海人工智能实验室｜2023-09-29

${ v.newstitle }

${ v.newstitle }

新闻动态

科研活动

${ v.newstitle }

${ v.newstitle }

人才招聘

招生信息

${ v.newstitle }

上海AI实验室 ICCV 2023 Tutorial｜活动预告

来源： 上海人工智能实验室｜2023-09-29

来源：上海人工智能实验室｜2023-09-29