青衫磊落,格究智理,学贯中西,胸怀报国宏图志,悲憾科海巨星陨,阴阳割昏晓;
丹心耿介,矢志原创,千古文章,情倾桃李满天下,惟愿此去山水寄,天地一沙鸥。
(〇)前言
2023年12月15日23时45分,夜幕低垂之际,著名的计算机科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥先生因病救治无效,在上海溘然长逝,终年55岁。[1][5]
此挽联以精湛的笔墨,凝绘了汤晓鸥先生短暂而又熠熠的一生。阴阳割昏晓、天地一沙鸥,这两句诗形成“晓鸥”的藏尾,皆出自诗圣杜甫笔下。
“造化钟神秀,阴阳割昏晓”是青年杜甫入世的蓬勃豪情。
“飘飘何所似,天地一沙鸥”是暮年杜甫出世的超然豁达。
杜甫先生,于公元七一二年一月生于河南巩县,中国最伟大的爱国诗人之一,《杜工部集》共收诗传世1400余首。
汤晓鸥先生,于一九六八年一月生于辽宁鞍山,中国最杰出的计算机科学家之一,论文累计被引用近14万次。
本文以描绘汤晓鸥先生与诗圣杜甫相隔千年的跨时空交织,谨纪念汤晓鸥先生。
(一)求学:岱宗夫如何?齐鲁青未了
“无路请缨,等终军之弱冠;有怀投笔,慕宗悫之长风。”人们或许都像王勃那样,是年少也是最痴狂,求学入世直指最高殿堂。杜甫先生是,汤晓鸥先生亦然。
735年,23岁的杜甫先生回家乡巩县参加“乡贡”,紧接着又直奔洛阳参加最高级别中央朝廷考试——进士考试。在杜甫投考的那一年,进士仅仅取录二十七名。[2]
1991年,23岁的汤晓鸥先生在此前取得中国科学技术大学的学士学位后,刚从美国罗切斯特大学硕士毕业,紧接着又申请了全球最顶尖的研究型高校——麻省理工学院(MIT)的博士。在汤晓鸥申请的那一年,MIT刚刚成立国际关系工作组以拓宽国际视野,将寥寥无几的橄榄枝抛给了中国最顶尖的申请者。[3]
最终,前者失意落榜了,后者则如愿拿到了录取通知书。而这一次千年前的考试,和一次数十年前的留学申请,给人类历史的齿轮上了两次有力的发条,主人公分别是在中国古典文学史和计算机视觉史上绕不开的两个名字——杜甫、汤晓鸥。两个人的人生轨迹,如同激荡的波澜,撼动着历史的长河。
站在23岁杜甫面前的前辈,是感慨“相思在万里,明月正孤悬”的卢照邻、是描绘“灶火通军壁,烽烟上戍楼”的骆宾王、是手书“落霞与孤鹜齐飞,秋水共长天一色”的王勃、是高唱“宁为百夫长,胜作一书生”的杨炯。
“初唐四杰”的佳作,影响了杜甫先生的一生。每当他背起这些脍炙人口的诗句,都回味感慨再三,直到晚年为他们挥笔创作了“王杨卢骆当时体,轻薄为文哂未休。尔曹身与名俱灭,不废江河万古流”的颂歌。
站在23岁汤晓鸥面前的前辈,是对递归神经网络(RNN)和长短时记忆网络(LSTM)有杰出研究成果的Yoshua Bengio、是神经网络和深度学习的重要推动者Geoffrey Hinton、是卷积神经网络(CNN)之父Yann LeCun。
但当时,深度学习就好像“时运不齐、命途多舛”的杜甫偶像之一王勃那样,只是人工智能领域分支中的分支,梯度消失问题笼罩着巨大的阴霾,决策树、线性模型如日中天,而深度学习并非一个独立的主流研究方向,更不用提今天人们耳熟能详的计算机视觉、大语言模型和AIGC(生成式人工智能)了。
想必,英年早逝的“人工智能之父”图灵如有幸能看到如今ChatGPT、MidJourney这样的AI工具,就像英年早逝的王勃读到李太白的“天生我材必有用,千金散尽还复来”那般惊艳吧。
尽管千年前的那场进士考试,第一次将杜甫“入世”进取的理想打入深渊,但不妨碍他考试后北游齐、赵之地的壮志豪情——
岱宗夫如何?齐鲁青未了。
造化钟神秀,阴阳割昏晓。
荡胸生层云,决眦入归鸟。
会当凌绝顶,一览众山小。
而千年后刚刚入学的汤晓鸥先生,也在MIT的校园里,获取新知、饱读论文,发表AI顶会、研究人脸识别技术的种子,也从那个时候悄悄地埋在了心里,并在日后数十年生根、发芽、开花、结出令世人瞩目的硕果。
(二)知遇:醉眠秋共被,携手日同行
如果二十多岁是考学进取、读书沉淀的尚好青春,那么三十多岁则是知交相遇、共话前途的黄金年华。
杜甫先生如是、汤晓鸥先生亦然。
33岁那年,杜甫先生两遇李白。“醉眠秋共被,携手日同行”、"笔落惊风雨,诗成泣鬼神"、"白也诗无敌,飘然思不群"、"世人皆欲杀,吾意独怜才"、"痛饮狂歌空度日,飞扬跋扈为谁雄"......诗圣从此为诗仙写下了十余首千古佳作。这是太阳和月亮的相遇,是相差十余年的“忘年交”,也是中国古典文学的一段优美佳话。
同样是33岁那年,汤晓鸥先生邀请到了自己的“忘年交”,比自己小九届的中科大学弟李学龙,前往他刚刚在香港中文大学创办的「多媒体实验室」(MMLab)进行访学;同年,另一位中科大学弟王晓刚也入学港中文攻读硕士。而后,陶大程、林达华、曹亮亮等中科大学弟亦接踵而至。[4]
彼时“乳臭未干”的MMLab,虽无“物华天宝,龙光射牛斗之墟”之物质生活;却有“人杰地灵,徐孺下陈蕃之榻”之济济人才,为今后跻身“世界十大人工智能先锋实验室”埋下了浓墨重彩的一笔。
回想起初唐时期杜甫与李白的相遇,那个时代的诗人就像今天的人工智能学者一样,群星汇聚、灿若星河。如此深入人心的碰撞,如轨道中运行的两颗明星,因为因缘际会产生了万有引力外的另一种神奇的力量,前者相遇在大唐盛世的辉煌璀璨中,后者邂逅在深度学习即将喷薄发展的新纪元。
杜甫、李白、贺知章、王勃、杨炯、卢照邻、骆宾王、陈子昂、宋之问、沈佺期、卢纶、崔颢、岑参......初唐的诗人踏出了一道光彩的道路,最细的纤尘也会显得熠熠生辉。
Geoffrey Hinton、Yoshua Bengio、Yann LeCun、Ilya Sutskever、张钹、孙剑、汤晓鸥、何恺明、李飞飞、吴恩达......深度学习也注定会有属于他的时代的名人堂成员。
李侯有佳句,往往似阴铿。
余亦东蒙客,怜君如弟兄。
醉眠秋共被,携手日同行。
更想幽期处,还寻北郭生。
入门高兴发,侍立小童清。
落景闻寒杵,屯云对古城。
向来吟橘颂,谁与讨莼羹?
不愿论簪笏,悠悠沧海情。
公元745年,杜甫和李白一同前去寻访范十居士的隐居后,创作的这首《与李十二白同寻范十隐居》,就像跨越千年的汤晓鸥先生携弟子游说尚在香港科技大学交换的林达华一样,结果都是那样令人欣慰和满意。而后来,林达华先生也像汤晓鸥老师一样前往MIT读博深造,2010年获得机器学习领域权威国际会议NeurIPS的最佳学生论文奖,后来接棒成为了MMLab的主任,为日后实验室在产学研结合、开源开放道路的探索上奠定坚实的基础。
(三)喷薄:好雨知时节,当春乃发生
如果说三十多岁是知交相遇、共话前途的黄金年华,那么四十多岁则是喷薄迸发、追求理想的成熟时期。
也许杜甫先生和汤晓鸥先生在这点也不谋而合。
公元758年,46岁那年,在长安已经奔走、干谒十余年,刚刚卸任右卫率府兵曹参军的诗人杜甫,开始进入了人生创作的最密集时刻之一。从洛阳返回华州的途中,目睹了战争带给普通百姓的深重灾难,感慨于时代的沧桑与人性的光辉,奋笔创作了两组名垂青史的史诗:“三吏”和“三别”,深刻揭示了战争对人民生活的破坏、从个人的角度展现了战争带来的家庭悲剧和社会的撕裂。
“存者且偷生, 死者长已矣!”、“哀哉桃林战,百万化为鱼。”、“宿鸟恋本枝, 安辞且穷栖。”、“勿为新婚念, 努力事戎行!”......除此之外,杜甫也在《题郑县亭子》《早秋苦热堆案相仍》《独立》和《瘦马行》等诗中,深刻地表达了对于个人仕途的挫败、对社会冷漠无情的感慨,以及对奸佞之人在朝堂上谗言蔓延的愤怒与失望;而后在华州及关中遭遇大旱之际,创作了《夏日叹》和《夏夜叹》,忧时伤乱,针砭世态。[6]
这一时期,杜甫的诗作不仅数量众多,而且在文学艺术成就上开启了一个新的里程碑。
2014年,同样是46岁,汤晓鸥先生领导的港中文MMLab实验室在深度学习视觉上的研究已经突破了学术与科研的边界,开始着手规划将理论研究转化为实际应用的蓝图。此前两年,MMLab 实验室在ICCV和CVPR共发表14篇论文,占全球深度学习论文的半壁江山。直到2014年的3月,其GaussianFace算法在人脸识别上达到了98.52%的准确率,首次胜过人眼,而6月的DeepID更是高达99.55%,实现了技术的飞跃,给深度学习从学术圈到产业界带来了第一块敲门砖。
好雨知时节,当春乃发生。
随风潜入夜,润物细无声。
野径云俱黑,江船火独明。
晓看红湿处,花重锦官城。
在四十多岁这个人生的关键时期,杜甫的先生诗歌不仅仅是记录个人的悲喜,也反映了他个人从青年时期的激昂向往到中年时期的沉思与感慨的转变。他的作品,不仅是他个人情感的抒发,更是一个时代的生动写照,对后世产生了深远的影响,有不少佳作入选了如今的中小学教材。
同样是在四十多岁,汤晓鸥先生的视野也从学术界拓展到产学研结合的大方向,反映了他个人从基础研究的丰硕成果转化到解决民生实际问题的思想转变。商汤科技的成立,不仅是人工智能产业化的一次吃螃蟹尝试,更体现了一帮象牙塔中走出的青年在人工智能领域悬壶济世的决心。
两人的成就,如同春雨润物,悄无声息却影响深远。
(四)为民:安得广厦千万间,大庇天下寒士俱欢颜
如果四十多岁是喷薄迸发、追求理想的成熟时期,那么年过半百、曾经沧海后,内心更多的想法莫过于范仲淹的“先天下之忧而忧,后天下之乐而乐”乎,亦或是金庸先生所书的“侠之大者,为国为民”。
在这点上,杜甫先生和汤晓鸥先生也似乎有所交集。
公元762年,50岁的杜甫先生已经历了长达数年的寄人篱下、艰苦卓绝的生活,时而漂泊在外,时而留守在成都浣花溪畔自建的草堂。“厚禄故人书断绝,恒饥稚子色凄凉”;“痴儿不知父子礼,叫怒索饭啼东门。”.......
这个时期的杜甫先生,诗歌创作又达到了新的高潮,不到两年,作诗四百三十多首,占现存作品的百分之三十。“无边落木萧萧下,不尽长江滚滚来”更成为千古绝对,余韵至今绕梁不绝。
2018年,同样是50岁的汤晓鸥先生,他所领导的MMLab实验室已经斩获无数殊荣、蜚声中外之时,又作出了一项令世人瞩目,至今影响力深远的工作——开源了以MMDetection和MMEngine(原MMCV)为核心的OpenMMLab,成为了深度学习时代最全面且具影响力的计算机视觉开源体系,在深度学习圈迅速火了起来。
从一开始的一万、两万、三万GitHub(国际权威的代码开源平台)星标,到如今的近十万颗星标,包括目标检测、实例分割、姿态估计、动作识别、OCR、AIGC,甚至是最近开源的语音合成方向,其300 种算法实现和 2000 多个预训练模型,帮助了全球 140 多个国家和地区的高校、研究机构和企业用户,解决AI落地的实际问题,影响了万千计算机视觉学习、从业人员。
近年来,以上海人工智能实验室的OpenMMLab为主体的开发者,在持续维护OpenMMLab的同时,也联合实验室的兄弟团队推出了性能领先的千亿级参数大语言模型 “书生・浦语”(InternLM),并建设了首个面向大模型研发与应用的全链条开源体系。
床头屋漏无干处,雨脚如麻未断绝。
自经丧乱少睡眠,长夜沾湿何由彻!
安得广厦千万间,大庇天下寒士俱欢颜!风雨不动安如山。
杜甫先生的“广厦千万间”,和OpenMMLab、InternLM的代码开源,普惠大众万千,不约而合。
(五)尾声:出师未捷身先死,长使英雄泪满襟
2023年12月19日那天,上海龙华殡仪馆就像如今的杜甫草堂亦或是杜甫笔下的丞相祠堂那样,人群熙熙,面色凝重,身着深色服装的人们自觉地排起了百米的长龙,只为向汤晓鸥先生作最后一次道别。
著名的计算机科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥先生,永远地离开了我们。
或许时空真的会交织,出生在正月的杜甫先生重新回顾他1400首诗的《杜工部集》,与出生在一月的汤晓鸥先生重新读一遍他那被引用14万次的论文集的时候,可能会是同一种心情吧。
又或许时空不会交织,百年之后的孩子在中学语文教材里看到杜甫先生的名字,又在人工智能教材里看到汤晓鸥先生的名字,分别会是什么样的心情呢?
在过去,深度学习时代悄然开启;在今天,AIGC(生成式人工智能)会被更多地提及;在未来,AGI(通用人工智能)或许会实现。但无论怎样,“人脸识别”算法依然会高效运转、解放无数的生产力;“去雾算法”、“残差网络”依然会是准备入门人工智能的年轻人的必读经典;OpenMMLab、InternLM等开源开放体系依然会为无数开发者提供最无保留的开源服务。
斗转星移,时易事迁,无论人工智能发展到哪里,回想起汤晓鸥先生那如三江之源一般的巨大贡献,后人站在江水最末端的黄浦江畔,也就是汤晓鸥先生晚年劳作办公的地方,我们依然会想起杜甫先生在诸葛丞相祠堂前的那句感慨——
出师未捷身先死,长使英雄泪满襟
(全文终)
参考文献
[1] 讣告|浦江实验室、上海人工智能实验室主任汤晓鸥逝世,上海人工智能实验室,2023
[2] 冯至.杜甫传[M]. 人民文学出版社,2019
[3] 美国麻省理工学院全球战略的分析及其对我国高校制定国际化战略的启示.黑龙江高教研究,2023 https://lgwindow.sdut.edu.cn/info/1015/43386.htm
[4] 致敬汤晓鸥:将港中文建成中国计算机视觉黄埔军校的人,雷锋网,2023
[5]沉痛哀悼汤晓鸥教授.中国科学技术大学新创公益基金会.https://www.ustcif.org.cn/default.php/content/5128/
[6]维基百科编者. 杜甫[G/OL]. 维基百科, 2023(20231213)[2023-12-13]. https://zh.wikipedia.org/w/index.php?title=%E6%9D%9C%E7%94%AB&oldid=80101318.