CNN之父从未有国家像中国,让深度学

来源：科学管理原理时间：2022/9/30

北京皮肤病医院电话 http://baidianfeng.39.net/a_yqhg/210125/8622627.html

“上海恐怕是世界上唯一会有人在街头拦住我并索要我的签名的城市，在美国只有电影明星才有这种待遇，科学家是没那么多人追捧的。这种热情令人难以置信。”

近日，谈及中国粉丝对于自己的喜爱，杨立昆（YannLeCun）在接受DeepTech采访时表示。

图

杨立昆接受DeepTech专访（来源：DeepTech）

最早在年，杨立昆曾应邀前往北京大学进行演讲。随后十多年间，他曾多次造访北京、上海等城市，热情的学生纷纷与他合影并索要签名。

近年来，中国学者开始在人工智能（AI）领域崭露头角，各大计算机顶会上都能见到国内作者发表的高质量学术论文。杨立昆也注意到了这一点，并给予高度评价。

他认为世界上还没有一个地方像中国那样，让机器深度学习成为国家级优先项目，并成为公众瞩目的焦点。更重要的是，中国年轻人对科学和工程的浓厚兴趣，让他印象深刻。

自幼喜欢科技，长大后与辛顿“双剑合璧”

在计算机从业者群体中，杨立昆这个名字几乎人人皆知。作为年的图灵奖得主之一，他与杰弗里辛顿（GeoffreyHinton）、约书亚本吉奥（YoshuaBengio）一起被誉为“深度学习三巨头”。

当今，许多AI应用都离不开“三巨头”构建的深度学习理论基础和指导框架。而杨立昆的主要贡献是大幅完善了卷积神经网络（CNN），并将其用于计算机视觉领域，极大地拓宽了应用范围。

近年来，神经网络红极一时。但在20多年前，计算机学界和产业界都对它完全提不起兴趣，甚至是嗤之以鼻。

在长达快15年的神经网络“寒冬”里，学术会议多次拒收神经网络论文，也没人愿意公开支持、甚至不愿公开谈论有关神经网络的话题，这让卷积网络一度成为大家口中的笑话。

至于具体原因，杨立昆自己也说不清楚，他说：“这是一个谜，我认为科学史学家和社会学家有责任解开这个谜团。”

图

“深度学习三巨头”：杨立昆，辛顿和本吉奥（来源：Facebook、Google、BotlerAI）

从自己做研究、到成为“技术布道家”，杨立昆虽是中年成名，但其根源可追溯到童年。

年，杨立昆出生在法国巴黎附近的郊区，父亲是一名航空工程师，酷爱DIY遥控汽车和遥控飞机等电子产品，同时他父母也都是科幻小说迷。这让他在童年时就对科技、太空和计算机充满了好奇和热情。

18岁，他进入巴黎高等电子与电工技术工程师学院（ESIEE）。大学五年，没有课的时候他就泡在图书馆里，从人类的语言机制，到大脑的工作原理，再到系统理论（控制理论）、自组织、自动化等一系列晦涩深奥的内容，他都悉数吸收。

当时，“人工智能”“机器学习”和“神经网络”这些概念都已出现。他认定，如果想让计算机变得更聪明，模拟人类大脑运作方式的神经网络将是可行的方向。

年前后，大四的杨立昆构想出一种可在网络中实现从后向前传递信号的算法，并将其命名为HLM算法（多层线性模型），今天广泛使用的“梯度反向传播算法”就是在HLM基础上发展而来。

不过彼时“神经网络”研究在法国几乎处于停滞，这让杨立昆颇为苦恼。机缘巧合之下，他在一场国际会议上见到了杰弗里辛顿（GeoffreyHinton），两人很快意识到，尽管他们此前从未谋面，但却有着相同的兴趣和研究思路。

“双剑”很快“合璧”，博士毕业的杨立昆受辛顿之邀前往加拿大多伦多，共同研究神经网络和反向传播。同一时期，在加拿大蒙特利尔，杨立昆认识了当时还在读研的约书亚本吉奥（YoshuaBengio），后者对神经网络的了解让杨立昆十分佩服，日后的“三巨头”终于相互见面。

图

年，杨立昆在ATT贝尔实验室发表的用神经网络识别手写字符的论文（来源：资料图）

从到年，神经网络经历了相对繁荣的十年。对于杨立昆来说，他的科研生涯也在美国贝尔实验室迎来了小高潮：入职仅两个月就开发出拥有6.4万个连接的LeNet卷积神经网络，主要用于识别手写字符。

最终，LeNet的升级版LeNet5拥有34万个连接，被部署到一个银行支票数字读取系统中，应用于美国和法国的许多自动取款机中。

这是卷积网络的首次商业应用，直到20世纪90年代末，美国所有支票的10%-20%都是由它处理的。

可惜高光时刻未能延续太久，随着贝尔实验室隶属的ATT公司拆分，混乱的管理和权力分划让人无暇顾及这个渺小的、不能赚大钱的系统。

中年被裁，经历十五年的“神经网络寒冬”

随后，“神经网络寒冬”降临，从年开始，持续了近15年。

“有五年多的时间，我们几乎没有再涉足机器学习的研究，只是发表了几篇整理性质的论文，”杨立昆回忆称，“于我而言，这些论文就像是天鹅临死前的最后哀鸣。”

当时，他先是被ATT裁掉，之后在日本NEC公司的普林斯顿研究中心也承受着研究快速落地和变现的压力，并不能潜下心来做科研。

于是在年，他决定应聘纽约大学的教授职位，这样至少可以安稳地做研究。

由于业界对神经网络不够重视，从到年，杨立昆、辛顿和本吉奥的论文几乎被所有机器学习领域的重要会议拒收，比如NIPS和ICML，而CVPR和ICCV这样的偏应用领域的大会也不太欢迎神经网络。

“寒冬”中三人抱团取暖，他们还借鉴“深层政府（deepstate）”这样的阴谋论，自嘲为“深度学习阴谋”小组。

熟悉杨立昆的人都知道，他是个性非常鲜明，说话直言不讳的人，对自己的想法坚信不疑。此前，他在推特上与各路网友争论并连发数十条推文，甚至一度表示要“彻底告别推特”。

这种特立独行的性格孕育他逆行的勇气，使他在无人看好神经网络的年代里，仍然全身心投入其中。

图

年，杨立昆等人将神经网络技术用于无人车避障（来源：资料图）

年，有关深度学习、神经网络等概念的论文逐渐被机器学习大型会议接受，虽仍有不小阻力，但至少不再像以前那么排斥。这离不开他们仨多年来的奔走疾呼，以及默默耕耘出来的研究成果。

自到年的十年间，杨立昆一直在纽约大学实验室里默默地扩展卷积网络的应用范围。

物体识别、面部检测、人脸识别、机器车的主动避障和自动驾驶、生物和自然物体图像的语义分割，这些即便在今天都很“新鲜”的技术，其实早在10-20年前就已被他挨个实现。

年前后，随着计算机硬件的进步（尤其是业界对GPU的应用）、以及数据量的爆炸式增加，杨立昆等人终于迎来春天。

后面的故事我们都知道了，由神经网络驱动的模型开始横扫各种比赛，以超出传统方法数倍、甚至数十倍的表现成为了计算机科学界的“新宠”。

“我想人们更了解AI”

年底，杨立昆将自己的科研生涯、人工智能技术的底层原理、以及自己对人工智能现状和未来的思考著成法语版《科学之路：人，机器与未来》一书。如今，中文版先于英文版问世。

图

杨立昆的书（来源：中信出版集团）

“我想让人们更加了解深度学习和人工智能是什么，而且毫不掩饰其中的复杂性，”

杨立昆解释自己著书的初衷，“人工智能已经在影响人们的生活，在未来可能会带来更大的影响，因此人们需要了解它是如何工作的。这本书兼具自传和科普属性，可以让喜欢叙事与喜欢科学逻辑推理的人同时享受深入机器的科学之旅。”

从最基础的学习机和感知器，到监督式学习，再到深度网络和和卷积神经网络，最后到无监督学习，这几乎是数十年来最引人注目的机器学习技术的进化过程，包括反向传播、CNN、ResNet、GAN在内的一系列经典算法和模型悉数出现。

乍看之下，这些内容背后充满数学模型和函数运算，令人望而生畏。但通过简单易懂的案例，带有注释的伪代码，以及环环相扣的推导，杨立昆希望让不同背景的读者都能明白人工智能的实现过程。

在许多理论和术语第一次出现时，杨立昆就给出了通俗的解释，连一元一次方程都有解释，细致程度堪比教科书。他告诉DeepTech：“我的目标是，如果你有高中数学水平，那么理解书中的数学概念就不在话下。即使跳过数学，也不影响对内容的理解。”

例如在理解自动驾驶的原理时，即使“向量”“梯度”“维度”之类的概念看得似懂非懂，也可以借助“车辆压到左侧白线，因此要向右调整”等通俗直白的解释搞清楚原理。

当然，现实情况比理论复杂的多，瞬息万变的路况、各国不同的交通法规、以及不守交规的情况都会打破人工智能模型所熟悉的“完美的世界”。因此，只有了解技术背后的原理，才能知道它的极限所在。

（来源：Pixabay）

过去五年，许多人对自动驾驶和无人驾驶的普及充满了乐观，按照一些媒体和企业年的预测，年就应该有数千台无人驾驶汽车（L4以上）行驶在路上，但现实并非如此，连L2、L3级别的辅助驾驶都时常出现问题。

其实，自动驾驶本质上是一个AI完备问题，不能单靠计算机技术来解决，而是必须有人类介入。

“AI需要人类的常识（

转载请注明：http://www.baoshijiec.com/yljg/13887.html

上一篇文章：事业单位公共基础知识高频考点三

下一篇文章：优秀CTO修炼之道向上生长,向下兼容