2022年北京冬奥会不久前落下帷幕,精彩的比赛、开幕式和闭幕式的“中国式浪漫”让人记忆犹新。这场盛事不仅见证了运动员的高光时刻,也借助以AI为代表的全方位科技力量,让时间、空间、语言、文化差异不再成为阻隔,实现了冬奥会“一起向未来”的愿景,成就了新冠疫情背景下一场前所未有的全球体育盛会。
正如科技部部长王志刚在总结“科技冬奥”所带来的延展、渗透和长期的效果时所言,这些科技成果,包括在基础研究方面、技术创新方面、应用驱动方面的一些成果,都会长期存在。
【智能感知与虚实融合:捕捉冰壶运动轨迹】
困难点:超大空间内精准捕捉小物体轨迹
创新点:视觉AI感知+深度学习+三维建模+空间定位
在科技部第三批科技冬奥专项支持下,科技公司和高校携手推进“冰壶赛况的智能感知与虚实融合技术和平台研究”课题项目,为北京冬奥会冰壶比赛打造“冰壶运动轨迹捕捉”技术,实时还原冰壶运动轨迹,帮助运动员了解冰壶分布情况,使线上线下观众更全面地了解冰壶运动的精髓。
“冰壶运动轨迹捕捉技术”应用于北京冬奥会冰壶比赛
“冰立方”是冬奥会历史上体量最大的冰壶场馆,冰壶比赛的每条赛道长40多米,各有两支队伍共8名运动员,技术团队需要在人多、遮挡物多的情况下,捕捉到每一个小冰壶。
基于中国原创的SenseMARS火星混合现实平台,通过视觉AI感知、深度学习、三维建模和空间定位等技术,团队克服了在超大空间环境下基于远视距对较小物体运动轨迹精准捕捉的难题,并通过对真实场景的数字化映射,实现对运动冰壶的检测跟踪和轨迹捕捉。
同时,团队设计的系统精准还原冰壶轨迹,结合实时渲染、虚实同步技术,将当前比赛对战信息、大本营虚拟画面,以及运动中的冰壶轨迹曲线等画面转化为视频流,同步输出到“冰立方”现场170㎡大屏和“咪咕视频”APP。
【3D+AI:让谷爱凌再飞一会儿】
困难点:高速连续的实时动作捕捉
创新点:三维建模+时空定格技术
当首钢大跳台上空飞出奥运健儿们的争金夺银的矫健身影,现场观众欢呼的同时,收看央视转播的观众也有如同身临其境一样的体验。
这是因为这些高速连续型的比赛在转播中都使用了“3D+AI”技术,通过模型将运动员们的滑行速度、腾空高度、落地远度、旋转角度等一系列运动数据与原始画面叠加起来,并把时序的连续动作定格到3D空间,形成如《黑客帝国》中经典的“子弹时间”一样的360°效果,让观众可全方位看到选手的每一个动作细节。再加上专业解说的技术分析,让原本对滑雪运动陌生的观众,也能基本了解不同动作的难度系数,以及裁判的评分标准。
“时空定格”将连续动作定格到3D空间
这项虚拟现实(VR)技术对首钢大跳台进行了三维重建,并切换日景、夜景、水景等不同的视觉效果,让转播观众们可以从多个景别自由观赏大跳台,拥有比现场观众更丰富的场景体验。
【牵手冰墩墩实现奥运村遛弯自由】
困难点:动态复杂场景下的精准定位跟踪
创新点:GPS与视觉融合的数据关联和参数分块优化+云端结合架构
运动员们共同生活的张家口冬奥村足有30万平米,除了已经蜚声国际的食堂外,还有很多人性化的设施。如何让91支参赛队伍准确寻找目的地,就是冬奥村专属导航的目标。
借助“基于3D的实时精准定位技术、虚拟与现实结合的3D高精度识别的智慧AR导航系统研究”课题,SenseMARS火星混合现实平台解决了动态复杂场景下实现精准定位跟踪等难题,短时间内实现了大尺度场景下厘米级的三维地图构建和部署,为张家口冬奥村打造创新的智慧AR导航应用。而且,通过AR导航虚实融合的数字世界,还可以和2022开年顶流共行,实现虚拟冰墩墩自由。
使用智慧AR导航,跟随冰墩墩玩转张家口冬奥村
这里的AR智慧导航主要面临两个技术挑战:一是研发时间紧,要在极短时间内完成超过30万平方米的大尺度场景高精度三维地图构建,对数据采集和算法效率都提出了很高要求;二是场景视觉变化复杂,冬奥村内建筑群风格统一,各个地方存在大面积相似纹理,且常有冰雪覆盖道路、植被和建筑,基于图像精准的识别自身位置存在很大挑战。
通过GPS与视觉融合的数据关联方法和参数分块优化方法,技术人员研发了云端结合架构实现云端全局定位和终端局部跟踪的协同。全局定位综合利用视觉、蓝牙、GPS等信号解决相似场景的问题,并针对冰雪场景,训练了不同天气条件下鲁棒的图像特征;移动终端借助云端地图信息和自身传感器在web低算力的条件下实现了稳定的跟踪,实现实时、精准的6自由度空间定位。
SenseMARS火星混合现实平台实现张家口冬奥村厘米级高精度三维地图重建
【金牌背后的“劳模”AI】
困难点:适配不同项目、动作影像模糊、复杂背景因素干扰
创新点:神经网络模型+光流跟踪技术
在这个奥运周期里,科技也被运用到了运动员们的日常训练之中,加码各个项目的夺金机会。
早在东京奥运会备战期间,研究团队就为了更高效地提升运动员训练水平,有针对性地建立起适用于竞技体育和一般生物力学研究的计算机系统——无反光点人体运动自动捕捉人工智能系统。如今,这个系统被沿用到国家速度滑冰和越野滑雪项目的冬奥会备战项目内容中。
智能“私教”冬奥会显身手
该系统利用基于人工智能技术中的深度学习原理,建立神经网络模型,实现对动作视频中人体关节点的计算机自动识别。在这些数据的基础上,系统对滑冰与滑雪运动员的动作捕捉与技术分析,既能精准到具体细节,又能快速反馈分析结果。通过在常用的运动人体跟踪算法中结合了光流跟踪技术,有效规避快速运动造成的影像模糊,减少复杂背景等因素干扰,根据动作量的多少、动作幅度的大小来准确锁定主ID(身份人物)。
在此基础上,研究人员采用基于计算机视觉算法对滑冰运动员的动作、姿态、速度等信息进行智能分析对比,从定性、定量再到定制化分析每个运动员的特点,实现科学训练,有效提升运动员训练效果和竞赛成绩。
【虚拟手语人助力“全民冬奥”】
困难点:让听障人士实时参与冬奥会
创新点:手语翻译引擎+自然动作引擎的数字人模型
在央视的冬奥转播画面中,突然出现了一个陌生的主持人。这位靓丽的女主播其实是采用3D高精超写实的数字人AI模型,不仅进行新闻播报,还能随时随地进行赛事的手语直播,让听障人士参与冬奥盛会成为可能。
AI 手语翻译官聆语上线央视视频
数字人主播主要运用了两个类别的AI技术:手语翻译引擎和自然动作引擎。首先,技术团队运用语音识别和自然语言处理等技术,将文字、语音和音视频内容结合翻译成《国家通用手语词典》中的标准手语,构建了AI主播的手语翻译引擎,然后再通过自然动作引擎的优化来驱动AI虚拟主播的手语动作,使其更加标准、流畅,和无声的世界共享冬奥激情。