星期五 , 3月 29 2024
首页 / 人工智能 / AI / AI新贵上位记:图网络是怎么火起来的?

AI新贵上位记:图网络是怎么火起来的?

AI新贵上位记:图网络是怎么火起来的?

谁是2018年AI圈最靓的仔?

这顶“桂冠”只有两位候选人:俗话说,前端能打看BERT,底层深度看图网络。

其实并没有这句俗话……但是BERT和图网络在今天的AI界并驾齐驱,堪称被讨论最多的两种技术,这一点是毫无疑问的。

谷歌的BERT作为一种算法模型,在语言任务上展现出了不讲道理的应用效果,熠熠夺目自然很容易理解。

但另一个最近大家听到很多次的词,图网络,可能就没那么容易理解了。相比某种算法,图网络更像是一个学术思考下若干种技术解决思路的集合,非常抽象和底层。它的价值到底在哪?为什么甚至能被抬高到“深度学习的救星”这种程度?

我们发现,目前关于图网络的解释,大多都是从论文出发。非技术背景的读者可能会看得有点晕。所以这里想用一些“大白话”,来描述一下:风口浪尖上的图网络,究竟有什么秘密?

想让自己在AI圈潮酷起来吗?聊Graph和GNN吧

所谓图网络,并不是指有图片的网络……而是指基于图(Graph)数据进行工作的神经网络。

Graph,翻译成“图”,或者“图谱”。这是一个数学概念,指由顶点(nodes)和边(edges)构成的一种数学关系。后来这个概念引申到了计算机科学中,成为了一种重要的数据形式,用来表示单元间相互有联系的数据网络。

此外,这个概念还引申到了生物学、社会科学和历史学等无数学科,甚至变成了我们生活中的常见概念。在警匪片里,警局或者侦探办公室的墙上,往往挂着罪犯的关系网络图,这大概是我们生活中最常见的Graph。


回到计算机科学领域,图数据和基于图的分析,广泛应用于各种分类、链路、聚类任务里。人工智能领域有个重要的分支,叫做知识图谱。基本逻辑就是将知识进行Graph化,从而在我们寻找知识时,可以依据图谱关系进行追踪和定位。比如我们在搜索引擎中搜某个名人时,相关推荐会跳出来跟这个人字面意义上无关的其他人。这就是知识图谱在起作用。

那么图网络是怎么搞出来的呢?

大家可能知道这样一个“唱衰AI”的小故事:用机器视觉技术,AI今天可以很轻松识别出来一张照片上的几张人脸。但它无法像真人一样,一眼看出来图上是朋友、恋人还是家庭聚会。

换句话说,一般意义上AI无法获得和增强用人类常识去进行逻辑推理的能力。很多人以此判断,今天的AI并不怎么智能。

AI科学家们琢磨了一下,表示这事儿有办法搞定。

如果把图/图谱作为AI的一部分,将深度学习带来的学习能力,和图谱代表的逻辑关系结合起来,是不是就好很多?

事实上,Graph+Deeplearning并不是一个全新概念。最早在2009年,就有研究提出了二者的结合。近几年这个领域陆续在有研究出来。对于这个组合产物,学术界有人称之为图卷积网络(GCN),也有人称呼其为图神经网络(GNN)或者图网络(GN,Graph Networks),其技术内涵和命名思路也各不相同。这里暂且使用图网络这个笼统称呼。

图网络作为一种新的AI研究思路,之所以能够在2018年被点燃,很大程度还是号称AI扛把子的DeepMind的功劳。

在火种抛出、全球跟进以及反复争论之后,图网络变成了AI学术圈最靓仔的那个关键词。今天大有一种,聊深度学习不说图网络就很low的感觉……

从识别小能手到推理专家:AI新贵求职记

有种论调是这么说的:深度学习已死,图网络才是未来。

这句话怎么琢磨都有问题。因为从图网络在去年被“翻新”出来那一刻,它在本质上还是对流行的多层神经网络的一种补充。

让我们来打个比方,看一下跟传统深度学习相比,图网络应该是如何工作的。

举个例子,假如我们想让教育我们的孩子,让他认识新来的邻居一家人。我们应该怎么办呢?可以选择给他讲,隔壁新来了某个小朋友,他爸爸是谁、妈妈是谁。但是这样不直观,孩子很容易记不住。

而更快的方式或许是拿着照片给他看,告诉他照片上的人都是什么关系。而在这个工作之前,其实我们已经完成了一个先觉条件:我们已经告诉过孩子,爸爸妈妈爷爷奶奶这些称呼,分别指代的是什么意思。他理解这些“边”,然后再代入新邻居一家人具体的样貌性格交谈作为“顶点”,最终构成了对邻居一家这个“图”的网络化认识。

而我们在用深度学习教导AI时,往往是省略掉第一步。直接给出大量照片和语音文字资料进行训练,强迫AI去“记住”这一家人的关系。然而在AI缺乏对家庭关系的基本常识情况下,它到底能不能记住,是怎么记住的,会不会出现偏差,其实我们都是不知道的。

某种程度上,这就是深度学习的黑箱性来源之一。

所以图网络的思路是,首先让AI构建一个“图”数据,先理解爸爸妈妈这一类关系的含义,再去学习具体的家庭数据。这样AI就可以依靠已经积累的节点间的消息传递性,来自己推理下一个要认识的家庭究竟谁是爸爸谁是儿子。

这也就意味着,图网络某种程度上有了自己推理的能力。如果将这种能力推而广之,AI就将可能在非常复杂的联系和推理中完成智能工作。

前面说了,这个领域的工作其实一直没有停止。但是之所以没有广泛流行,一方面是因为这个领域相对小众,缺少重磅研究来引发大家的关注;另一方面也是因为看不见摸不着,缺少开源模型来检验理论的正误。

去年6月,DeepMind联合谷歌大脑、麻省理工等机构的27位学者,共同发表了关于图网络的论文《Relational inductive biases, deep learning, and graph networks.》,接着开源了相关的算法包GraphNet。

这篇文章中,DeepMind不仅提出了新的算法模型,希望能用图网络实现端到端的学习;同时也总结归纳了此前图网络各个流派的研究方法,并将其在新算法上进行了融合。

在这个有点承上启下意味的研究出来后,大量关于图网络的综述、应用检验,以及新算法的探讨开始在学术界萌生。随着全球AI圈的共同发力,这门AI技术新贵正在尝试走向台前。

图网络,到底有什么用?

这个问题或许可以分远近两方面看。

近的方面,有一些AI要面对的任务,天然就属于图结构数据。因此用图网络来学习和处理可谓事半功倍。比如说社交网络、智能推荐、化学分子预测、知识图谱等领域,都被证明可以广泛应用图网络技术来提升智能化效率,降低算力消耗。

而在非结构化数据,比如语音、文本、图片等场景,图网络可以用来提取结构化信息。比如在图片中更好地识别家庭成员关系,认识图片中正在发生的行为等等。此外,图网络还能为数据的优化组合提供更加智能化的应用。

而从长远方面看,图网络是对图谱技术和深度学习技术两个技术领域的融合与再拓展。这不仅让沉睡已久的,AI中的知识表示流派具备了复活的潜力。更重要的因素在于,图网络可能让深度学习打开因果推理这扇大门。

具体一点,作为一种底层逻辑上的更新,图网络似乎可以起到对深度学习几个原生缺点的弥补:

1. 增强AI可解释性

“臭名昭著”的深度学习黑箱,来自于大量非结构数据输入之后,算法进行归纳的逻辑无从掌握。而图网络可以操作知识的归纳逻辑,看出行为的因果关系,显然对是黑箱性的一次突破。

2. 减少“人工智障”式的视觉错判

在机器视觉领域,AI另一个广为人知的问题,就是对对抗攻击的低抵抗力。比如AI本来已经认识这是鸟了,结果照片上沾一个黑点,它又不认识了。这个问题来自于AI本身识别的是像素,而不是物体概念本身。图网络如果将物体关系带入其中,或许会让AI的视觉判断力更像人类。

3. 小样本学习的可能性

深度学习的另一个问题,就是很多算法必须经历超大规模训练来提升精度。而这也是对算力和数据的暴力消耗。如果能让AI具备逻辑上的迁移可能,那么具备人类常识的AI,将可以在很小的数据样本中完成相对复杂的工作。

4. 向着通用智能的一小步

我们知道,AI今天的主要能力是识别和理解,而推理是其若想。假如图网络弥补了这一弱势,是否意味着AI将从单体智能向通用智能走上一步呢?

这么多价值的图网络,显然想不火都难。2019年,或许将是图网络放出更多光芒的一年。

然而也别太乐观,这个更多光芒完全是个相对值!虽然今天很多声音高调吹捧图网络的价值,但要看到,图网络并不是AI的万能钥匙。

心头一动,道阻且长:如何看待图网络的发展现状?

虽然今天产业端对于图网络的应用还没有怎么被提及,但就我所接触过的AI学术界人士,确实普遍对图网络报以非常强烈的兴趣。

当然了,对图网络的争议今天也普遍存在。整体而言,对它的整体评价分为了三个流派:

1. 悲观派。有一种观点认为,图网络无非是对深度学习劣根性打的一个补丁,属于深度学习走不下去了,打算绕绕路。而且这个补丁并没有被证明有效。今天还只是停留在概念和浅层实验阶段。

2. 客观派认为,图网络是深度学习发展的必然趋势和重要补充,恰恰证明了AI作为一种底层技术正在不断发展成长,拓展自己的边界。不管图网络是不是真的能做到畅想的一切,至少证明了深度学习体系在今天是有发展能力的。

3. 乐观派则提出,图网络的关键意义,是让AI能够获取常识和推理能力,这种能力显然是人类智能的一个重要代表。我们一直期待的AI走向通用化的强人工智能,会不会就从图网络开始呢?在他们看来,图网络是关乎于AI去往下一个时代的关键开关。

到底哪一派更接近未来的真相呢?可能就交给诸位和未来一起检验吧。

总体而言,图网络是一种对今天流行的AI体系,从技术思想,到技术逻辑的一次重要修补和升级。它在某种程度上是一个未来,但今天还缺乏实践检验和有效工作。

在实践中,图网络的限制还非常多。比如其表示能力不足,无法承担太复杂的图结构数据。并且对计算复杂度要求很高,对今天的计算架构又提出了新的挑战。

而且图网络主要解决的是AI对结构化数据的处理,而在动态数据、大规模数据、非结构化数据等领域,图网络的作为依旧有限。

再一个,虽然AI是一个高度产学一体化的学科,从前瞻性研究到技术实践的周期已经被大大缩短。然而要客观看到,二者并不是无缝对接的,从算法理论提出到实际应用,还是会有一个比较长的蛰伏期。我们不能指望去年的AI学术明星,今年就走进千家万户。

总之呢,这是个让人动心的技术,但今天还仅仅是发现了藏宝图。真正的宝藏,大概还在千山万水之外。

关于 声波

声波
发现不同的声音

检查

真假“长文本”,国产大模型混战

Kimi有多火爆?凭一己之力搅 …

发表评论

邮箱地址不会被公开。 必填项已用*标注