【讲座简介】
掩码图像建模(MIM)在自监督视觉表征学习研究中得到了广泛的应用,并在高层语义视觉任务中显示出巨大潜力。掩码图像建模(即图像补全任务)是Low-Level视觉任务的一个基本问题,并在近二十年取得了很大的进展。在深度学习时代,围绕这一问题,当前的研究热点是寻找高分辨率图像大面积补全的有效解决方案。基于此,李文博及相关团队提出了一种掩码感知transformer(MAT),可以在不同的场景中产生优异性能。此外,为有效进行底层视觉的预训练,团队在综合研究的基础上,还开发出了基于transformer的图像处理系统的有效预处理策略。
【本期嘉宾】
李文博,香港中文大学在读博士,师从贾佳亚教授,主要研究方向聚焦底层视觉,包括超分辨率、图像着色、图像去噪、插帧等任务。在CVPR、AAAI、ECCV、NeurIPS等顶级会议上发表多篇论文,曾入选CVPR Best Paper Finalists。
【主持人】
王毅,上海人工智能实验室青年研究员。其主要研究方向包括图像生成、图像/视频理解等,已在CVPR、ICCV、ECCV、TPAMI、NeurIPS等国内外知名学术期刊及会议发表论文十余篇,曾入选CVPR Best Paper Finalists并两次被接收为Oral。
【参与方式】
活动时间:2022年7月22日 10:30-11:30
腾讯会议号:462992580