DeepMind要用认知心理学方法研究AI, 打开深度学习黑箱

最近，DeepMind在Arxiv上发布了Interpreting Deep Neural Networks using Cognitive Psychology，将认知心理学的方法引入深度神经网络的研究。

这是DeepMind入选今年ICML(机器学习国际会议)的论文之一。在公开论文的同时，他们还在官方博客上对这篇论文做了介绍。

为什么要用认知心理学方法来研究深度神经网络呢？

我们经常在新闻中看到，深度神经网络的能力不断提升，在图像识别、语音识别以及玩各种游戏的能力上，一一超越了人类。

不过，随之而来的也是越来越复杂的架构，和越来越看不懂的决策过程。

也就是所谓的“黑箱”问题。

黑箱

现在，每次提到深度学习，“黑箱”这个词似乎如影随形。DeepMind的论文中说，“这种不透明性不仅阻碍了尝试提升这些模型的基础性研究，也影响了它们在实际场景中的落地。”

怎么打开这个黑箱，成了研究界关注的一大问题。很多团队想开发“可解释的人工智能”，让AI解释自己的行为。但是，Google工程总监、AI经典教材《人工智能：一种现代的方法》的第二作者Peter Norvig说，这根本就行不通：

人类都不擅长不了自己，就别指望机器了。

DeepMind这篇论文，正是把研究人类心智这个大黑箱的方法，用到了深度神经网络上：通过测量神经网络的行为来推断内在的认知机制。

他们借用了一个用以说明人类认知过程的实验，来理解深度神经网络怎样解决图像分类任务。

形状偏好

DeepMind这篇论文，借用了发展心理学中研究儿童如何学习物体和词对应关系的方法，来分析深度神经网络。

认知心理学研究表明，人类儿童在将物体和词对应起来的过程中，存在三种偏好：

整体偏好：当你指着一个物体，说出一个词，孩子会假设这个词指的的整个物体，而非部件；

分类偏好：孩子会假设一个词指的是物体所属的基本类别；

形状偏好：孩子会假设一个名词的意思是基于物体的形状，而不是它的颜色或质地。

DeepMind借用的，是研究形状偏好的认知实验，因为认知心理学在这方面的研究最为丰富。

DeepMind测量深度神经网络的形状偏好所用的刺激物样本，由印第安纳大学认知发展实验室提供

DeepMind所用的经典形状偏好实验过程如下：

1. 给深度神经网络看三个物体的图片：1）基本调查物体、2）形状匹配但颜色不匹配的物体、3）颜色匹配但形状不匹配的物体。

2. 比较神经网络在分配标签时，为物体1和2分配相同标签的次数，和为物体1和3分配相同标签的次数所占比例如何。

DeepMind的实验表明，深度神经网络和人类一样，具有“形状偏好”。

论文摘要

深度神经网络（DNN）在众多领域的复杂任务上都有着卓越的表现，它迅速地刷新着我们对于这些问题的认知。

过往的工作只着眼于推进我们对于这些模型的理解，但对于认知心理学家在这些问题上已有的描述、理论和实验方法，却没有加以充分利用。

为了发掘这些工具的潜在价值，我们选择了在发展心理学中一种用来“解释儿童如何学习物体和词对应关系”的固定分析方法，并将其应用到DNN上。

用和原有认知心理学实验类似的刺激物数据集进行测试，我们发现，那些在ImageNet上训练的、最好的单个样本学习(one shot learning)模型表现出了一种与在人类身上观察到的相似的偏好：它们更喜欢根据形状来对物体进行分类，而不是颜色。

在这种偏好的程度在架构相同但seed不同的模型上，会有非常大的差异，甚至会在训练过程中随着seed而波动，尽管它们最终在分类上的表现近乎相同。

这些结果证明了认知心理学工具在发掘DNN隐含计算属性上的能力，同时也为我们提供了一种用于人类字词学习的计算模型。