以创新之力触及“智”变
——记合肥工业大学多媒体计算所教授、黄山青年学者王杨
2023-05-31
作为数字技术创新最活跃的领域之一,人工智能凝聚了计算机视觉、自然语言处理、跨媒体分析推理、智适应学习、群体智能、自主无人系统、智能芯片和脑机接口等关键技术,加之大数据的积累、理论算法的革新、计算能力的不断提高和网络设备的不断完善,目前人工智能的研究与应用已经进入了一个崭新的发展阶段——其在基础层、技术层、应用层的上下游产业链也正在逐步建成,人工智能的应用场景从硬件扩展到了软件、服务与平台体系,在工业、农业、医疗领域的行业应用不断深入,展现出巨大的市场潜力和广阔的发展前景。而近期“横空出世”并引起广泛讨论和关注的ChatGPT,即“人工智能有望在未来掀起一场新的工业革命”的一个有力佐证。
求木之长者,必固其根本;欲流之远者,必浚其泉源。以见证者和亲历者的身份,合肥工业大学多媒体计算所教授、黄山青年学者王杨坚守着“自己去寻找、自己去发现”的科研初心,一步一个脚印地行走在深度学习、模式识别、多媒体计算等基础研究的一线,不断突破着自己的“天花板”。在他看来,亦步亦趋绝非长久之计,自主创新和弯道超车才是我国人工智能领域发展的必由之路,而他的愿望,是与团队一道在理论创新和技术创新的层面持续发力,为我国人工智能发展贡献力量。
转变与执着
2009年,忙于本科毕业设计的王杨,得到了一个改变他一生研究道路的建议:“大三的时候,我跟随一位外国老师学习概率模型的知识,在发觉我概率学、统计学、线性代数的成绩不错后,他随机问了我几个相关问题来测试我对这些内容的理解。而在得到我的回答后,这位老师就很积极地建议我先从发表相关领域的论文入手,循序渐进地去做以信息论和概率模型为切入点的数据驱动相关研究。”王杨回忆道。经过一年的学习和接触,已经对相关领域产生兴趣的他听从了老师的建议,考取了天津大学的硕士研究生。在研究生导师的悉心指导下,王杨有的放矢、厚积薄发,全力汲取着知识、累积着经验。这段经历,成了他日后走向人工智能领域的一把钥匙,也为他展开后续研究打下了坚实基础。
从“好读书不求甚解”的门外汉,到初窥门径的科研新秀,王杨并未满足于此。在做数据驱动研究时,他发现相关数据并不足以支持研究运转,为此,他展开了基础研究工作,并累积了一定数量的图片数据。“这也激发了我的思考,能不能在这些数据的基础上构建更好的模式识别系统?如果可以,那我如何为这一模式识别系统建立更好的训练方式和训练集?”由浅入深思索激励了他更为蓬勃的科研热情,也让他萌生了往机器学习和模式识别方向看一看、走一走的想法。就此,他考取了澳大利亚新南威尔士大学计算机科学与技术专业的博士学位,就此正式步入模式识别、机器学习、多媒体计算研究等研究方向,开展相关的学习和研究工作。
“转换跑道”的日子,是辛苦而充实的。在“授人以渔”的博士生导师帮助下,王杨接受了系统的科研训练并掌握了基本的学术方法,也得到了与业界不同细分领域专家交流讨论的机会。在此过程中,不断有新的科研灵感闪烁于他的脑海,而以脚踏实地的研究将乍现的灵感变为现实、“去做有挑战性的科研工作”的信念也就此埋在他的心间。游学澳大利亚期间,“两耳不闻窗外事”几乎成了他生活的常态——“新南威尔士大学附近有很多中餐馆,甚至有一家就在我当时住处的楼下,但是我一次都没有去过。”王杨笑着说道。最终,夜以继日的勤劳结出了硕果。谈及一路走来的心得和感悟,他将其归结为“基础+努力”——“其实我的天赋没有那么高,是本科和硕士期间比别人起步早了一些的‘时间差’,再加上勤能补拙,才让我得以在这条新路顺利地走下来。”
与王杨越发明确自己要选的科研方向几乎同时,国内相关研究也同样方兴未艾。大量涌入的“新鲜血液”和不断丰富的学术成果,让王杨看到了国内人工智能发展的巨大潜力,也让他萌生了回国报效的想法。恰逢此时,同样深耕于人工智能领域的青年学者、合肥工业大学计算机与信息学院院长汪萌向他伸出了橄榄枝。“我在攻读博士学位期间,就和汪院长在多媒体计算领域有一些交流。可能因为是同龄人的缘故,我们的沟通特别顺畅,这番经历也带给了我很多启发。等到我博士毕业、选择回国后,汪院长更是为我提供了很多帮助和支持。”当时,在汪萌及其团队的共同努力下,合肥工业大学计算机与信息学院取得了长足的发展,聚集了一批颇有建树的年轻科研工作者,其牵头成立的多媒体计算所也赢得了不斐的国际声誉。高水平的学术团队,让王杨心向往之;良好的平台、专注做学术的氛围,为他从事科研工作提供了有力保障。就此,王杨作别澳大利亚,回到了分别数年的祖国并入职合肥工业大学计算机与信息学院。他期待用所学所思之成果,在祖国大地上开出新的花朵。
突破和验证
“找到所研究领域中真正具有挑战的方向和问题加以研究”是王杨回国后为自己定下的目标。从自身的经历出发,他讲述了确立这一目标的心路历程:“2011年我出国时,当时国内人工智能相关的文章和成果并不多。到现在,国内相关会议和期刊论文的数量已经呈现几何式增长,但真正能够解决本领域最核心的具有挑战性问题的文章依旧是少数。然而,一国在领域内的影响力和话语权往往是由这些真正‘触及根本’、引起重大反响的成果决定的。就此,我下定决心,不要做简单的重复,而是要去真正的前沿之地寻求突破。”
据王杨介绍,他目前所做的研究有两个最重要的组成部分:其一是数据,其二是模型。且数据和模型之间绝非孤立存在,而是互相促进的共生关系。“在数据量越来越大的情况下,它会随之变得越来越复杂,而在这种大数据海洋‘冲击’之下,传统的理论和模型会发生变化。就像我们现在所做的研究,虽然基础理论和模型是一样,但是实际上在不同的大数据情况下,其网络的训练策略、架构等都会产生变化。”
从这一事实出发,王杨着力探索深度网络学习的更多可能性。作为一个已经存在数十年、且有相当数量研究成果的领域,他从深度学习的可解释性和智能性入手,逐一阐述这一模型的变化性、独创性及可应用性。
“深度学习就像一个一层套一层的黑盒,其本质是上一层的输出作为下一层的输入。”王杨解释道,“就像折纸一样,对折一次可以出现2个分区,再对折可以出现4个分区,以此类推下去,深度网络的层数越多、相应的分区也会越多,其识别的细腻度就会随之提升。”由于深度学习高度依赖于训练数据集,王杨选取了大量的数据训练集对其进行优化,进一步规避数据集“偏见”对最终结果的影响。在此基础上,他还尝试将多个深度网络进行互相借鉴和训练融合,从而得到远优于单一深度网络输出的结果。“在深度网络调配协作的过程中,较为强势的网络被称为‘教师网络’,较为弱势的则被称为‘学生网络’。基于人工智能模仿人类认知行为的最终目标,如何界定这两种网络的形态?如何进行人工智能模拟?如何进一步拓展深度学习网络的智能化程度?这都是我们需要探索的内容。”
依托国家自然科学基金青年基金项目“基于合作式的多视图数据深度子空间聚类的研究”、国家自然科学基金重点项目“网络空间虚拟身份塑造及应用技术”和“多模态环境下的多媒体对话分析与理解”、国家自然科学基金面上项目“基于生成对抗网络的无监督跨域行人识别方法研究”等多个重要科研项目,王杨不仅在多个科研细分领域取得了亮眼的成绩,也在这一过程中得到了充分的锻炼和成长。在申请项目之初,作为新人的他并没有很大的信心,此时又是汪萌院长的鼓励让他坚定地扛起了自己的科研责任——“很早之前,汪萌院长告诉我做科研要‘勇于创新、勇于突破’,而申请国家项目则是将现有的学术基础及学术成果进行整合,而后在此基础上真正去提出有价值的创新点,从而形成一个具有先进性的国家项目,这对于科研创新和产业落地都将有极为积极的意义。”
万事开头难。对于充满干劲的王杨来说,这种困难同样没有缩减分毫。为了写好项目申请书,他在春节都不曾休息,夜以继日地埋首于各个项目的准备过程中。“当时时间紧、任务重,基本上每天都要工作到夜里12点左右。每写好一次,我就和汪院长一起讨论,然后再按照他的建议反复修改。”王杨回忆道。最终,功夫不负有心人,集合了钻研和交流的合力,2019年,他如愿申请到了包括国家自然科学基金青年基金项目在内的多个重要项目。回首这段经历,王杨颇为感慨地说:“项目申请成功之后,我当时非常高兴,因为这一方面意味着,我学会了一项重要技能——学会了如何去写作重点项目申请书;另一方面也意味着,我所做的研究是符合国家和行业发展趋势的,是具有价值的。”
以此为起点,将学科发展、创新及成果融合于一个个具有挑战性和前瞻性的科研项目中,王杨的科研之路正一步步绽放出属于他自己的耀眼光彩。他先后在模式识别相关领域顶级杂志与会议上发表文章80篇,获得2014年亚太数据挖掘大会(PAKDD)最佳论文奖亚军,其中两篇论文被选为国际人工智能联合会议(IJCAI)最有影响力文章之一,7篇成为基本科学指标数据库(ESI)高被引文章并全部进入Top 1%列表,王杨本人也于2022年入选美国斯坦福大学统计发布的人工智能与图像处理领域全球顶级科学家名单。
褪去青涩、直面挑战、创新不辍,在王杨看来,“明确认知、植根实际、着重创新”是科研之路得以行稳致远的不二法门。“首先,我要明确自己要做怎样研究的问题。这是基于前期的科研成果和实践积累,要全面、充分、深刻地认识这个问题,找出其核心,是做一切科研工作的基础。其次,不单单要从问题出发,更要考虑其落地的前景,从结合实际需求的角度入手,以应用为前景进行有实际意义的研究。最后也是最重要的,我不希望研究工作以简单地重复或者单纯以发表文章为目标,创新仍是科研工作的第一要义。同时,这个创新不是无本之木、无源之水,它必须是紧密地结合在自身科研基础和应用背景下的创新,是兼顾基础性和创新性的扎扎实实的创新。”
正如王杨所期待和追求的那样,他的努力也同样在产业化过程中结出了硕果。自2022年起,王杨团队积极开展与相关企业的合作,通过国家自然科学基金重点项目等方式,集中解决产学研转化“最后一公里”未打通的种种难题,以关键理论和模型为企业实际产品赋能。“在数据和模型层面,仅仅依靠我们和企业是远远不够的。下一阶段我要做的事,就是寻找更多的合作方,将理论成果更加广泛地应用到具体实践中,让科研成果最大限度地发挥其作用。”谈及产业化的前景,王杨如是说道。
薪火照未来
人如其名,在王杨眼中,科研工作“独木难成林”。身为一名高校教师,为行业发展培养新鲜血液同样是他极为看重的工作内容。在教学过程中,王杨从个人经验出发,在教授知识的同时也向学生传授思考问题的方法。在他看来,增强学生学习兴趣最好的奖励就是及时的反馈和有效的互动;此外,以创新为第一要务的王杨还特别看重学生举一反三、主动思辨的能力。“光听课、只会重复老师的思路是不够的,要基于老师的授课内容进行深入思考,并由此衍生出自己的见解。”在充分挖掘学生的特长和潜力的基础上,王杨始终对学生的学术成果保持着“高标准、严要求”——“如果标准定得很低,那他们的成果将不会有很强的竞争力,进而在世界范围内激烈的科研竞争中‘失利’,这对学生的信心是一个重大的打击,也会造成时间和成本的巨大浪费。而如果在最初,我就将标准定得高些,虽然刚开始做的时候会有点难,但当他有一定成果之后,一定会促使学生产生强大的信心和对相关研究的兴趣,而这将是鼓舞他们在科研之路长期走下去的重要力量。”王杨解释道。在他的努力下,学生勤学善思的科研习惯已逐渐形成,师生之间的“正向反馈路径”也已建立,“学生们都很用功,也在不少行业内顶级会议上发表了文章,作为一名教师,这也是让我比较欣慰的一件事”。
与此同时,王杨也充分重视实践与合作的力量。近年来,随着人工智能的发展,王杨也将自己的研发重心由原来的模型和方法的探索逐渐转向理论的创新和验证,做实验也成了他科研工作的主要内容之一。“做实验可以推动我们去开拓更多理论,理论则能支持我们去做更多的实验。理论和实践来回交互、互相推动,这也是我们挖掘新理论的根基所在。”在此基础上,他通过与高校、研究机构的沟通交流,开展学生培养、学术交流、项目合作等多项合作,进一步推动学生的成长和科研水平的进步。带好学生、做好科研、打好基础、逐步扩展,是他为自己定下的工作目标。
持续的努力为王杨赢得了学界的认可。2019年,刚刚回国不久的他就被选为信息搜索领域国际杂志《计算机学会信息系统学报》(ACM Transactions on Information Systems)的副主编,当时的他是唯一一位尚未在这一杂志上发表文章的入选者。得益于共同培养学生的经历,王杨的科研思路、科研方法得到了杂志主编的认可,并促成了相关研究的进展——“当时主编认为其中一项研究的成果已经达到发表的水平,但是我觉得这个深度还不够,还有继续挖掘的潜力。所以我就坚持将那个问题继续深入研究,最终的结果也确实比原先的成果高出一倍以上。”王杨回忆道。他始终认为,获得这一机会很大程度上源自自己对于“研究就要做得比别人更深”的执着,而能以这份执着得到业界的认可,是他的幸运,也是他继续努力的动力之一。
谈及未来的规划,王杨坦言,他还是希望以学术研究为阵地,充分挖掘理论创新的更多可能。他常说做科研的过程就是一个不断发现自己不足的过程,而他期待凭借自己和团队的共同努力,找出不足、弥合差距,通过不断完成一些具有挑战的创新性工作,最终建设一支国内乃至国际上具有一定影响力的科研团队。当被问及具体的发展方向时,王杨认为尽管人工智能面临着重重挑战,但仍是以算法为其关键所在。故此他选择了人机交互方向作为下一步的主攻方向,以期解决“机器如何为人民服务?”“机器如何更好地工作?”“人机如何配合以达到和谐状态并完成共同任务?”等问题,以点带面地推动人工智能的未来发展。
在采访的最后,王杨也谈到了他对ChatGPT的理解——“ChatGPT不是简单的‘问答工具’,它事实上是通过监督学习将搜索到的信息图进行分析和整合,这个过程不是一次性的,而是通过一手、二手、三手……不断地将有价值的信息抓取并发送出来,这也是其被认为可以取代一些行业的核心竞争力所在。”而ChatGPT的问世也激发了他对于我国人工智能发展的思考:“经过多年的发展,我们在解决问题和发表文章层面,数量和质量都得到了很大的提升。然而在发表高质量学术论文的基础上,我国如何提出新的概念、新的解决方案,最终可以产出一个像ChatGPT这样具有重大创新意义的概念或者产品,这将是我们要为之努力的方向。如果可以在这个过程中攻克一两个关键问题,为我国人工智能行业发展贡献力量,我觉得很荣幸。尽管命题宏大、道路漫长,但我坚信只要有梦想、有坚定的毅力、有扎实的行动,梦想就有实现的可能。”王杨笑着说道。
来源:科学中国人 2023年4期 封底人物