首页 > 详情

悲伤,他做出最强AI,却突然去世

南风窗

12月16日下午,一则令人悲痛的消息传来,商汤科技创始人、人工智能科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥因病救治无效,于2023年12月15日23时45分在上海逝世,终年55岁。


汤晓鸥是我国人工智能领域的杰出代表,主要研究方向为计算机视觉(CV)、模式识别和视频处理,其团队在2014年自主研发的DeepID系列算法是当时最强的人脸识别技术,超越Facebook同期发表的DeepFace算法,开启了整个人脸识别行业技术落地的时代。


他在科学家、教授与创业者几重身份间从容转换。自AI研究出发,他打破了实验室与商业市场的边界,创立的商汤科技在港交所敲钟,是“AI四小龙”之首;从计算机视觉界的黄埔军校香港中文大学的多媒体实验室(MMLab),到人才重镇上海人工智能实验室,他提携了诸多后辈。


他是热衷“晒娃”的慈爱父亲,儿子铭铭的照片多次在学术会议上作为案例亮相,“因为第一,这是我儿子,第二,他长得漂亮”,还请求台下翘楚们记住儿子的脸,今后好帮忙写推荐信;他的艺名“小o”源于在微软亚洲研究院的演艺生涯,彼时他身负文工团团长一职,连续三年出任晚会主持人。


他还是个东北人,爱调侃,以“被AI耽误的脱口秀演员”“CV领域著名喜剧人”之名被同仁津津乐道,次次亮相都带来欢笑。2017年云栖大会的组委会告诉他演讲有一千万人在看,他出人意料:“我非常紧张,所以我做了一百页的ppt,十万人一页,组委会很紧张,问我会不会超时,我就保证说,一定会的。”在2018年1月的EmTech China峰会上,他一语中的:“如果你5年前想进入AI领域,那很好。但是现在进入AI领域,你会发现5年后,所有人都在做AI,你甚至找不到工作。Follow your heart, never follow anyone else.“



1.png

MMLab官网,图中男孩为汤晓鸥儿子铭铭


关于人工智能到底会不会统治人类的话题,汤晓鸥表示离人工智能行业越近的人,越会觉得人工智能统治人类这事儿非常遥远,反而是离炮火越远的人听到一点炮声就赶紧危言耸听,他随即给出“权威”发言:“不要相信权威,他不一定是这个领域的权威,当然我的话是可以信的,因为我不是权威。”


汤晓鸥最近一次出席的公开活动是今年7月在上海举办的世界人工智能大会(WAIC),他在开幕式发言中,说自己每天晚上睡觉前,都是一边听着于谦老师的相声,一边在想:“机器怎么可能超过这样有趣的灵魂?我不信。”


如今我们失去了一位AI领军人物,一个有趣的灵魂。



人脸识别背后的面孔


站在2023年末,机场、高铁站的门禁机,结合身份证OCR和人脸识别的实名认证,美图软件的特效化妆、刷脸支付等等早已是我们生活中习以为常的一部分,但如果向前追溯,机器识别人脸的准确率首次超越人眼,仅仅发生在不到10年前。


2014年3月,汤晓鸥团队发布研究成果,原创的GaussianFace人脸识别算法准确率达到98.52%,超过了人眼97.53%的识别率,6月推出的DeepID系列算法将准确率提升至惊人的99.55%,突破了应用落地的门槛。


这要从汤晓鸥的科研之路说起。1968年,他在辽宁鞍山出生,自小就对图像产生了浓厚的兴趣,看了大量的图画书,这为他未来从事计算机视觉研究埋下伏笔。


2.png

2010 年,汤晓鸥在中国科学技术大学/中国科学技术大学


计算机视觉是人工智能的一个领域,是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息并采取行动,工作原理类似人类视觉依靠视网膜和神经,依靠摄像头、数据和算法进行训练。这个过程运用深度学习模型和卷积神经网络技术,反复迭代直到能够辨别差异并最终识别图像为止。


1990年,汤晓鸥从中科大毕业赴美深造,先后于1991年获得美国罗切斯特大学硕士学位,1996年获得麻省理工学院(MIT)博士学位。他在MIT第一次接触到了人工智能:“我加入那个实验室是做海底机器人的,相当于在水下用声纳和视觉相机来探索这个海底世界。在我去之前那个实验室刚刚发现了泰坦尼克号”,藉由做深海沉船研究的契机,他展开了计算机处理图像的工作。


博士毕业后,汤晓鸥前往香港中文大学信息工程系任教,于2001年7月建立香港中文大学多媒体实验室,这个初创团队正是商汤科技的前身。


在把计算机视觉、人工智能应用到日常生活的道路上,“天下第一铭”是浓墨重彩的一笔,2003年3月9日儿子汤之铭在香港出生,6个月后便随妈妈返京。汤晓鸥在北京香港间辗转,于2005年至2008年兼任微软亚洲研究院(MSRA)视觉计算组主任。


3.jpg

2010年7月2日,汤晓鸥教授在西区做《从暗原色中寻找光明》报告并与同学们交流/中国科学技术大学


他在自述中写道“总感觉和铭铭在一起的时间太少,想把每一分钟都记录下来,结果照了大量照片。于是很自私地号召大家做照片管理方面的研究”,成功做出了Photo Tagging,能够在成千上万张中快速整理出具备相同特征的照片,这让汤晓鸥在家里再次成为“有用之人”,“终于做了点有用的研究”。


2009年是个拐点,汤晓鸥率领MMLab团队与MSRA孙剑等人合作、由学生何恺明担任一作的论文《基于暗原色的单一图像去雾技术》夺得亚洲第一篇CVPR顶会最佳论文奖。暗原色是自然图像中存在的一个基本性质,即在任一普通图像的任意小块内,总有至少一个点其一个原色通道的数值接近于零,以暗原色为先验知识,对单一图像的去雾处理达到了近乎完美的程度。


4.png

汤晓鸥与何恺明(右)/香港中文大学


在自然图像被研究几十年后,发现全新的图像本质特性是视觉领域的重大突破。汤晓鸥以“从暗原色中寻找光明”概述科研态度。但令人唏嘘的是,在旷视担任首席科学家、研究院院长的孙剑亦因突发疾病抢救无效,于2022年6月14日离世,享年45岁,这篇斩获殊荣的论文作者而今仅余一人。


5.png

《基于暗原色的单一图像去雾技术》论文截图


原创的黑羊


也是在2009年,汤晓鸥的得意门生之一王晓刚从MIT博士毕业回到香港中文大学任教,与汤晓鸥搭档。2011年,杰弗里·辛顿和微软的中国学者邓力在深度学习语音识别上取得划时代突破,汤晓鸥团队亦于2011年转向到深度学习。2011至2013年期间,在CVPR和ICCV两个计算机视觉领域顶级会议上,全球共有29篇文章做了深度学习,其中有14篇出自汤晓鸥的实验室,全世界其他的实验室做了15篇。


“我们有18项工作在全世界第一次将深度学习用到视觉问题上,包括人脸识别、人脸检测、人脸重建、物体检测、人体姿态、图像超分、三维形状识别等计算机视觉最核心的问题。在深度学习的大门上,我们按了18次门铃。”汤晓鸥说。


在人工智能领域,算法超越人的准确率即是工业化的红线,一旦突破,大量应用将会出现。DeepID人脸识别技术正是出自王晓刚之手,IDG资本合伙人牛奎光迅速飞赴香港,只看了实验Demo就决定投资,“这是IDG唯一一个没有看产品就投资的项目。”


6.jpg

2023年7月6日,上海,2023世界人工智能大会,香港中文大学教授汤晓鸥发表主题演讲


2014年8月,IDG投出了高达数千万美元的A轮融资,2014年10月,商汤科技成立。商汤的名字缘于商朝是中国最早同时期的文字记载的王朝,农业、手工业迅速发展,甲骨文诞生并得到应用,汤晓鸥希望以这个朝代所具有的开创性,寓意公司的技术原创精神。


商汤的商业模式就是坚持原创,汤晓鸥将商汤的使命制定为“坚持原创,让人工智能引领人类进步”。当投资人质疑“你们花100分力气原创,跟随者花1分力气复制,投入产出比没法计算”时,汤晓鸥回应:“如果你原创的速度比跟随者复制的速度还要快的话,就没有人愿意复制了。这就是‘逃逸速度’,在地球上往上跳的时候你一直都会感受到重力,但当初速度大于第二宇宙速度时,你就不再会感受到地球引力束缚。”


汤晓鸥有着做技术平台的愿景,以AI+赋能百业,人工智能基础设施建设、算力平台的布局都与原创使命密切相关。他表示:“我并不是在研究AI,AI并不是一个独立的产业,AI+才是我们的工作。”


汤晓鸥还明确拒绝“狼性”,推崇羊的文化,在2018年世界人工智能大会主论坛上,汤晓鸥介绍商汤是很有同情心,很有同理心的公司,“我们提倡的是,吃的是草,挤出来的是AI”。但羊也有缺点,比如说羊群效应,“因此我们想做不一样的羊——黑羊(Black Sheep),去做别人没有做过的事情,甚至是别人想不到的事情。”


2016年1月8日,汤晓鸥参与中科大的新创科学论坛“遥望2025”暨“互联网发展史:技术,财富与文明变迁”。他首先澄清他是世界上最好的视觉专家的说法“失实,绝不科学”,玩笑道“我是世界上第二的计算机视觉专家,这样每一位都很高兴,觉得他是第一”。他还说“人工智能尤其是计算机视觉发展一日千里”,“胆子太小,不敢遥望2025”,于是他把自己的主题定为“未来的人工智能,展望2020”。


7.png

商汤科技首页展示的AI相关内容


这不得不说是一种洞见,2016年AlphaGo战胜李世石,AI投资热潮席卷。到2020年底,商汤累积完成了12次融资,募资总额约52亿美元,2021年12月30日如愿以偿登陆港交所。商汤上市之初股价飙涨,汤晓鸥身价一度高达500多亿港元。但从2018年至今,商汤在研发方面持续投入大量资源,净利持续亏损,商业化探索路径仍不明晰。


同时随着2023年大语言模型的爆火,深度学习创造价值的AI 1.0时代偃旗息鼓,今年4月10日,商汤分享了以“大模型+大算力”推进通用人工智能发展的战略布局,并公布了该战略下的“日日新SenseNova”大模型体系,其中最新研发的大语言模型被命名为“商量SenseChat”,但反响平淡。


最新的消息是,11月28日,商汤科技遭美国做空机构“灰熊”做空。商汤在12月5日的公告中回应,截至公告日期,汤晓鸥自公司上市以来并无出售任何由其实际拥有的公司股份。另据12月18日公告,汤晓鸥所持A类股份的不同投票权已随逝世而终止,将按照一换一比例转换成公司B类股份,继续受限于此前自2022年12月30日开始起计的两年期间内的自愿禁售承诺。


最好的时光


2019年商汤科技人工智能论坛上,汤晓鸥特地换了一套双排扣西装,开场就解释说“希望对融资有帮助”。但据商汤人士对媒体透露,汤晓鸥自2019年起保留执行董事身份逐步淡出商汤,“基本只在年会上才会出现”,更多回归研究者与教授角色,以2020年7月成立的上海人工智能实验室主任的身份活跃在学界和业界。


回顾他以往的表达,不难看出这样的选择似乎更加顺应汤晓鸥的性情。在2017年由清华经管学院主办的“洞见”论坛上,汤晓鸥在与马化腾、饶毅及清华经管学院院长钱颖一等人的圆桌讨论上妙语频出,他说:“有人说创业就是痛并快乐着,我想跟在座的各位说:只有痛,没有快乐。”


他还以冷笑话的方式回应当时国内初创科技公司在压力之下站队BAT的排他竞争风气:“我们是很愿意跟大家都合作的。实际上我们做学术的是有骨气的,就是说不能为五斗米折腰,但是你如果有六斗的话……毕竟它比五斗多一斗。”马化腾和在场嘉宾称他段子手,他表示他并非段子手而是幽默:“段子手是为了搞笑而搞笑的,幽默是看到事物的本质。事物的本质只有两个方面,一个是可笑的一面,还有一个是更可笑的一面。”


8.jpg

2017年9月8日,钱颖一与斯坦福大学教授布莱恩•克比尔卡(左二)、腾讯公司董事会主席兼首席执行官马化腾(左三)、斯坦福大学教授张首晟(右三)、北京大学教授饶毅(右二)、商汤科技创始人汤晓鸥(右一)在清华经管学院对话/商务印书馆


时值AI创投火热,慕名来听AI的学生络绎不绝:“我上次来,400个学生的房间都满了,网上有4000个人报名,这是有多么热。”而汤晓鸥想说:“如果说大数据热的时候你跑去学大数据了,O2O热的时候你跑去学O2O,这就有问题。其实你应该做最擅长的事情,你原来最擅长什么就做什么。你如果原来是跑马拉松的,不能是现在百米热了,就练百米了。所以,一定要留在你擅长的和你能力所在的这一块儿。”


汤晓鸥秉持相同的态度对待爱子铭铭,他见过太多天才,崇尚强者过招华山论剑,但儿子幼时便“不爱学习又厨艺精湛”“经过长期观察最擅长的就是玩儿”,那么他就顺势而为,“学习很差,但是你要让他发展其他的东西”,许愿铭铭长大时“可以选择的已不只华山这一条路,总不能人人都上华山,太挤了,希望有更多的山可以上,有更多的路可以走”。


9.jpg

2018 年 11 月 13 日,汤晓鸥在麻省理工学院中国峰会(MIT China Summit)上展示铭铭的照片


这种宽宏温情、思虑周全的作风贯穿了汤晓鸥甘为人梯、奖掖后学的研究教育生涯,也给予了他桃李满天下的回报。回到1997年,汤晓鸥初回港中大做“青椒”时招不到学生——当时香港顶尖学生追求去美国读博,而香港的教授们则想要尽量让学生多在自己身边做研究,师生矛盾显著。


汤晓鸥决定,学生要去美国,那自己就做学生最有利的跳板。他的原则是学生要足够勤奋,且申请名校的愿望够强烈,他会为学生铺路,强推申请。此后局面打开,汤晓鸥的学生在实验室读完硕士,一一被麻省理工、斯坦福等名校录取,清华大学等名列前茅的学生在口口相传中也渴望“师从汤晓鸥”镀金。


后来这群最聪明的学生发现,从美国名校毕业的归宿也是诸如谷歌、Facebook、微软等公司,而作为汤晓鸥的博士留港毕业也有相同的出路,这让汤晓鸥拥有了人工智能最广泛的学生群体,在商汤起步时提供了高密度的人才支持,也充实了整个中国AI尤其是计算机视觉领域的研究和产业界。


在今年7月他公开出席的最后一次发言中,他以自己最得意的三位学生的成就总括自己的AI生涯:王晓刚在深度学习兴起的最初几年,洒下了很多原创的种子,让机器的人脸识别首次超越了人类眼睛,成为与他并肩在商汤的联合创始人;何恺明将深度学习的根基打得非常牢、非常深,开发了计算机视觉领域的流行架构深度残差网络(ResNets),解决了深度网络梯度传递的问题,成为当前GPT等大模型系列的基础;林达华主导发起了国际上最具影响力的视觉算法开源项目OpenMMLab,通过开发和大模型让AI大树枝繁叶茂。


汤晓鸥表示:“让我非常欣慰的是,这棵大树已经开始开花结果。就在两周前,我们的自动驾驶大模型从9155篇文章中脱颖而出,获得了CVPR 2023年的最佳论文奖。”这是改革开放以来第一篇全部由中国学者完成的国际计算机视觉三大顶会的最佳论文,“新一代的学生已经在上海成功起步”。


发言的最后,汤晓鸥再一次向学生、老师和合作过的同仁们致谢,并援引了他认为AI难以超越的“有趣灵魂”于谦,在电影《老师好》里的一句台词:


“我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。”


11.png


版权所有 上海人工智能实验室
地址:上海市徐汇区云锦路701号西岸国际人工智能中心37-38层
联系方式:comm@pjlab.org,cn