现在的人工智能只是“窄 AI”?
1956 年,由数学系年轻的助理教授 John McCarthy 领导的科学家小组齐聚新罕布什尔州的达特茅斯学院,计划进行一个为期六周且雄心勃勃的项目:创建一种能够“使用语言、形式抽象与概念,帮助人类解决各类现存问题并自我改善”的计算机。
随着项目帷幕的徐徐开启,人工智能 (AI) 领域也正式出现在世界之上。当时的科学家们认为,“只需要 2 个月时间加 10 名研究人员”,就足以解决 AI 谜团中的核心难题。在第一份 AI 提案中,赫然写道“只要能组织一批精心挑选的科学家共同研究一个夏天,我们就能够在一个或者多个问题上取得重大进展。”
然而经历了六十多年的探索,真 - 人工智能的时代仍然遥遥无期。我们仍没能打造出拥有与人类儿童相近思维与解决问题能力的思考机器,更遑论成年人。但是,探索的脚步从未停歇,突破也在持续来临——时至今日,人工智能领域已经呈现出人工通用智能 (AGI) 与人工窄智能 (ANI) 并立的局面。
通用 AI 与窄 AI 之间有何不同?
正如 McCarthy 和他的同事们所设想,AI 代表着一种人工智能系统,有能力学习任务并解决问题,且全程无需人类为其明确指示操作细节。这类系统需要能够进行推理与抽象,并轻松将已经掌握的知识从一个领域转移到另一个领域。
研究人员经历了数十年攻坚,并意识到 AI 系统确实很难满足以上提到的所有条件。而能够模仿人类思维过程的计算机 AI 这一原始愿景,也被更名为“人工通用智能”。
根据维基百科的说明,AGI 是指“一种能够理解或学习人类方式并完成任意智能任务的机器。”目前,科学家、研究人员以及意见领袖的普遍观点是,我们距离真正的 AGI 至少还有数十年的发展历程。
但在实现这一创造思维机器梦想的持续努力当中,科学家们还是设法发明出各种实用的技术。而窄 AI,正是这类技术的统称。
所谓窄 AI,是指那些特别擅长处理单一任务或者特定范围内工作的系统。在大多数情况下,它们在特定领域中的表现远优于人类。不过一旦它们遇到的问题超过了适用空间,效果则急转直下。换言之,它们无法将自己掌握的知识从一个领域转移到另一个领域。
例如,谷歌下辖 AI 研究实验室 DeepMind 开发的机器人能够在即时战略游戏《星际争霸 2》当中屠杀人类选手; 而一旦将对抗平台换成《魔兽争霸》或者《命令与征服》等其他同类游戏,它的竞技水平会立刻下降至智障级别。
尽管窄 AI 无法全面执行需要人类智能的任务,但在特定场景中仍然非常实用,而且已经在诸多应用之内发挥着自己的作用。谷歌搜索查询现在可以利用窄 AI 算法回答问题; 窄 AI 系统会在 YouTube 及 Netflix 中推荐用户可能感兴趣的视频,并在 Spotify 中按喜好整理出周推音乐列表。
事实上,在大多数情况下,每当我们听说某家企业“利用 AI 解决了某些问题”,或者是在新闻头条里看到与 AI 相关的消息,他们指的都是人工窄智能。
窄 AI 技术的不同类型
目前市面上存在的窄 AI 技术可以大体分为两类:符号型 AI 与机器学习。
符号型人工智能 (又称传统 AI,GOFAI) 在很长一段历史时期中都是学术研究的主要领域。符号型 AI 要求程序员精心定义规则,借此引导智能系统的行为,符号 AI 适用于那些具备可预测且规则明确的应用场景。尽管过去几年当中,符号型 AI 的关注热度有所下降,但我们目前的大部分应用程序仍然以这类方案为基础。
机器学习则属于窄人工智能的另一分支,通过示例建立起智能系统。机器学习系统的开发者负责创建模型,并为其提供大量示例以完成“训练”过程。机器学习算法将处理这些示例,并建立起通过数据中的数学表示执行预测与分类任务的能力。
例如,经过训练的机器学习算法能够从成千上万条银行交易操作及结果 (包括合法及欺诈行为) 中学习知识,并据此预测新的银行交易活动是否存在欺诈嫌疑。
机器学习一派还包含多种不同风格。深度学习属于机器学习内的一种特殊类型,并在过去几年中得到全球各界的关注。深度学习特别擅长执行那些数据内容较为混乱的任务,例如计算机视觉与自然语言处理。
强化学习又是机器学习的另一个子集,大部分游戏机器人使用的正是这种窄 AI 类型。其核心实质,在于通过反复试验尝试解决问题。
我们为什么会长期停留在窄 AI 阶段?
符号型 AI 与机器学习只能各自反映出人类智能中的一个侧面,但却无法将各个必要部分组合起来,共同建立起涵盖完整人类智能的 AI 系统。也正因为如此,我们才长期停留在窄 AI 阶段,再难前进一步。
符号操纵是人类思维过程中的重要组成部分。但是,单靠符号操纵并不足以反映完整的思维体系。我们会在童年时期学到多种技能 (走路、奔跑、系鞋带、搬运、刷牙等等),这些技能彻底融入了我们的血液当中——无需任何形式的符号操纵,我们都能随时随地利用潜意识将其掌握。
符号 AI 系统非常脆弱,开发者需要对其面对的每一项任务做出精确指导,而系统也只能在严格符合定义的规则范围之内运行。
在另一方面,机器学习算法则比较擅长模仿那些符号推理捕捉不到的行为,例如人脸及语音识别,并通过示例掌握人类熟知的各类技能。在这方面,深度神经网络 (深度学习算法中使用的结构) 表现尤为出色。其能够摄取大量数据,并开发出数学模型以表征其中的模式。
但同样的,人类的学习过程也并不能简单概括为纯粹的模式匹配。例如,我们只需要看过几张小猫的图像,就能借此识别出一生当中见到过的形形色色的小猫。对人来说,从意识到什么是猫到准确识别出猫是个一气呵成的过程,但 AI 系统还远做不到、且必须在学习中引入许多符号操纵因素 (猫有四条腿、一根尾巴、体表大多布满茸毛、长着尖耳朵和三角形的鼻子等等)。
符号操纵的缺失,限制了深度学习与其他机器学习算法的功能。深度学习算法需要大量数据,才能达到人类仅通过极少示例就掌握的任务执行能力。具体来讲,用于计算机视觉的卷积神经网络 (CNN) 往往需要通过成千上万张图像,才能完成对各类对象的识别训练。即使如此,在遇到新的光照条件或者相同物体的不同呈现角度时,这些模型还是会快速败下阵来。
诸如 AlphaGo、AlphaStar 以及 OpenAI Five 等 AI 游戏系统必须经过数百万场比赛或者数千小时的训练,才能弄明白某一款游戏究竟该如何操作。单从训练强度来看,这一数量已经远远超过任何人 (甚至十个人) 一辈子的游戏时长。
机器学习系统还严格受限于训练示例所涉及的上下文范围,窄 AI 一词也正源于此。例如,无人驾驶汽车当中使用的计算机视觉算法在遇到异常状况时,例如非正常停放的消防车或翻倒的汽车,很容易做出错误的决定。
窄 AI 之后,下一个时代是什么?
科学家们一致认为,我们目前拥有的任何 AI 技术中都尚不包含人工通用智能的任何必要部分。更要命的是,大家甚至对 AI 接下来该往何处去都各执一词。下面来看扩展人工窄智能的几种主流思路:
认知科学家 Gary Marcus 建议应该将基于规则的系统与神经网络结合起来,建立起混合型 AI 系统。已经有部分工作示例表明,神经符号 AI 系统确实有望克服窄 AI 面临的数据约束。Marcus 写道,“建立架构的第一步,是将符号化方法的优势与来自机器学习的洞见相结合,据此开发出更强大的技术,进而从充斥着大量噪音信号的大型数据集内提取并归纳抽象知识。”
计算机科学家 Richard Sutton 合作撰写过一本关于强化学习技术的开创性著作,在他看来超越窄 AI 的解决方案在于进一步扩展学习算法。Sutton 认为,人工智能行业的进步主要归功于“单位计算成本呈指数下降这一持续性趋势”,而非我们真的找到了将人类知识与推理更好地编码到计算机软件中的方法。
深度学习先驱 Yoshua Bengio 在去年的 NeurIPS 大会上谈到了系统二深度学习算法。根据 Bengio 的介绍,系统二深度学习算法将能够在无需集成符号 AI 元素的前提下,执行某种形式的变量运算。Bengio 指出,“我们希望打造出能够理解真实世界的机器,建立起良好的环境模型,使其能够理解因果关系,并在这样的真实环境下采取行动来获取知识。”
另一位深度学习先驱 Yann LeCun 在今年的 AAAI 大会上谈到了自我监督学习。自我监督学习 AI 应该能够通过观察世界来学习,而不再需要大量标记数据。LeCun 在会上解释道,“我认为自我监督学习代表着未来。它将让我们的 AI 系统,特别是深度学习系统进入一个新的水平,有望通过观察来了解关于这个真实世界的背景知识,甚至深化出某种认知常识。”
我们如何判断自己是否跨过了窄 AI 这道“坎”?
目前,人工智能面临的一大挑战,在于人们总会为其设下持续发展的目标。只要还有问题未得到解决,我们就不能盲目断言关于通用智能的宏愿已经实现。而从另一个角度出发,只要能够解决所有问题,那么计算机就将拥有真正的人工智能。不过其中的悖论在于,对于机器能够解决的问题,我们又往往认为该问题的解决并不需要智能。
这方面的典型例子就是国际象棋,这项棋类运动曾被视为人工智能领域的试金石,在重要性方面堪比二十世纪初引发遗传研究突破的果蝇基因破译。但 1996 年,计算机“深蓝”成功在棋盘上击败了国际象棋世界冠军卡斯帕罗夫。此后,人们开始认为国际象棋不足以证明计算机是否拥有真正的智能——相反,它是纯粹利用计算能力检查所有可能的棋步,并选择其中最有利于取胜的选项。这就在原理层面束缚了 AI 系统的意义,而且目前在特定任务中表现出色的窄 AI 系统 (例如在餐厅中接听预约电话的聊天机器人) 也存在相同的问题。
窄 AI 的发展,从多方面证明了我们原本认为必须依靠人类智能解决的问题,实际上完全可以拆分成数学方程式加简单算法的形式。
就在最近,人们开始更多通过更常规、更具一般性的问题衡量 AI 系统的能力。这方面,我向大家推荐由 François Chollet 撰写的《关于智能的度量 (On the Measure of Intelligence)》,这篇论文是这位 Keras 深度学习库的创造者带给全人类的又一份宝贵财富。
在论文中,Chollet 探讨了如何衡量 AI 系统在解决未经明确训练或指示的问题方面表现出的能力这个核心议题。在这篇论文中,Chollet 提出了抽象推理语料库 (ARC),用于对能力假设做出一系列提问式检验。就在今年早些时候,谷歌组织的数据科学与机器学习竞赛平台 Kaggle 也发起了针对 ARC 数据集的挑战项目。
虽然问题难度过高,几乎没人能在短时间内攻克难关并拿到资金,但项目的提出仍然给了我们一把衡量 AI 真实智能水平的重要标尺。从窄 AI 到能够与人类相比肩的真 - 思维机器,我们到底还有多长的道路要走? 这个问题的解决,同样是通往人工通用智能的一级关键基石。