文图/ 王磊
西安电子科技大学模式识别与智能系统硕士
前不久,据华尔街日报报道, Uber在一宗无人车的测试过程中,造成了一名行人死亡的严重交通事故,除此之外,环顾我们身边,苹果手机的虚拟个人助理Siri有时会无法识别我们在说什么;某些人脸识别支付应用也存在着一些安全问题。这些事件反映出来的一个情况是,目前的AI似乎并没有足够的智能,甚至并无法很好地处理从外界获取的信息。
人脑中的神经网络是一个非常复杂的组织,成人的大脑中约有1000亿个神经元,人类至今仍在探索人脑的工作原理。而人们通过对生物神经元的研究和理解,构建了一个模拟人脑的计算模型:人工神经网络!
图/https://image.so.com/
那么,人工神经网络是什么?人类通过构造神经网络,能否给AI赋能,使之自我进化?
什么是神经网络?
简单来说,神经网络是一种模拟人脑的计算架构;利用神经网络进行机器学习,则让计算机不再只是执行命令的机器,而是具有了一定程度上分析判断的能力。当然,这个能力也离不开海量的数据和高超的计算能力。
一个经典的神经网络一般包含三个层次:输入层、隐藏层和输出层。而这三个层分别模仿的是神经元的树突、轴突和轴突末梢。输入层接收外部的输入数据,比如图片、文本、语音等,通过,隐层抽象数据的通用模式,进而通过输出层输出模型的计算的结果。
历史上,科学家还设计过多层的神经网络,每一层都会对前一层传来的结果进行再次加工,目的是模拟出一种“深思熟虑”的感觉,但最后发现结果准确度并没有提高,有的时候还会陷入误区,就像人容易朝着一个思路越陷越深,最后钻牛角尖了一样。随着技术进步,让这一问题得到改善。现在,最厉害的神经网络技术不但已经非常接近人脑,还排除了很多人脑自身存在的低效的思维方式。
柯洁在与AlphaGo大战后,在接受腾讯体育记者的采访时表示,“我也不敢想象,它居然可以把棋下得那么强硬,撑得那么满,好像好多块棋扭在一起,那是人类擅长发挥的地方了。跟它下棋会发现它处理得好像比我们人类还好很多,其实那一刻是很绝望的。甚至是那些研发它的人也不知道是怎么做到这一点的,研发它的人是下不过它的,很多人甚至不懂棋,居然能创造出这么一个怪物。所以,我唯一能感受到的是它对形势的乐观和自信,而且是绝对的乐观和自信,这一点人类是没有的。再自信也不会像它那么自信,无论你验证多少次,它都是不可战胜的。”
神经网络为何无法实现人类的推理并产生意识?
“机器人是否具有意识”一直是人们所争论的焦点之一,而在这其中,人工神经网络的技术发展起着重要的作用。对当前的人工神经网络而言,解决某些特定场景的问题,特别具有优势,但解决人们习以为常的问题却非常困难。比如,MIT媒体实验室研究员joy buolamwini研究文章称,人脸识别技术针对不同种族的准确率差异巨大,其中针对黑人女性的错误率高达35%!
中国工程院院士郑南宁指出,人工智能研究的一个重要方向,是借鉴认知科学、计算神经科学的研究成果,使计算机通过直觉推理和经验学习,将自身引导到更高的层次。然而,人脑对真实世界的理解、非完整信息的处理、复杂时空的任务处理能力是当前机器学习无法比拟的,还有人的大脑神经网络结构的可塑性,以及人脑在非认知因素和认知功能之间的相互作用,都是很难以形式化、公式化的描述。
图/https://image.so.com/
神经网络是怎么应用到各领域的?
神经网络虽然缺乏人类解决问题的强大理解能力,但却可以通过海量的计算从大量的数据中找到一些通用的模式。因此它们作为辅助工具,已经在各行各业,尤其是在多媒体领域体现了自身的价值。
手写数字识别应该是神经网络最早的商业应用之一。大部分的人都可以轻松识别下图中的手写数字,但要设计一套计算机程序来识别这些数字,就会发现视觉模式识别的难度。而神经网络的思想是,利用大量的手写数字,即训练样本,从中自动学习到识别各个数字的规则。而且随着样本数量的增加,神经网络可以学习到更多信息,从而可以进一步提升准确度。目前最好的商用神经网络已经足够好到能被银行用来处理支票,以及被邮局用来识别地址。
MNIST手写数字数据集一览
手写数字或许有些过于简单,那么使用神经网络发现地外行星,就更能显示它的能力了。谷歌和得克萨斯大学奥斯丁分校合作,利用上万颗被标记的恒星数据,训练了一个卷积神经网络,训练结果显示,神经网络判别行星的准确率高达96%。然后,研究人员让这个神经网络处理2009年到2013年观测到的670颗恒星的数据集,通过微小的特征变化,发现了两个星系存在地外行星的可能性非常高。经过研究人员的验证,确认了这两颗新的行星。
神经网络发现的开普勒-90星系与太阳系的对比
近日,美国FDA首次批准了用于检测糖尿病视网膜病变的人工智能产品:IDx-DR。这次FDA评估了来自10个初级卫生保健点的900名糖尿病患者的视网膜临床研究图像数据,IDx-DR能够正确识别轻度以上糖尿病性视网膜病变的准确率为87.4%,而正确识别没有轻度以上的糖尿病性视网膜病变的准确率为89.5%。
在目前比较火热的无人车领域,虽然各大厂商还在研究测试通用的解决方案,但在一些具体的案例上已经有了一些成果。图森未来使用自主研发的深度学习感知算法,能够做到让摄像头像人眼一样实时感知行车周边环境,检测和跟踪视野中的各种物体,能够对可视场景进行像素级的解读。凭借视觉高精度定位和多传感器融合技术,能够实现高速公路上的无人驾驶,帮助货运企业降低成本,加快货运周转。
总之,神经网络在不断地影响着生活、医疗和出行,但科研界对它有更多理性的看法。伯克利大学机器学习专家Michael I. Jordan认为,计算机科学仍然是最首要的学科,人工智能还无法取而代之,而神经网络只是该领域中仍在发展中的一个部份。
“现在要问神经网络会把我们带多远还为时尚早。”最看好神经网络发展前景的专家题讨论成员——OpenAI共同创办人兼研究总监Ilya Sutskever表示,“这些模型很难理解。例如,将机器视觉作为一种程序真的很不可思议,但现在我们对不可思议的问题都能提出不可思议的解决方案了。”
无论如何,我们目前正处理人工智能对社会的变革过程中,它们已经从实验室过渡到了商业部署。无疑,广泛的工业领域将受到庞大的数据和数据分析功能的深远影响。尽管神经网络还无法实现基本的人类推理和理解力,但它们将是建构人工智能漫漫长路上所用到的重要工具之一。
虽然现在神经网络还无法产生意识,但随着信息科学、认知科学、神经生物学、心理学等前沿学科和交叉学科的深度融合与不断发展,人工智能将会迎来新的发展高潮。
(审稿/谦恒,北理工大学网络中心助理研究员
网络信息安全专家)