阿里的 AI 局

2019 年 9 月 27 日,一年一度的云栖大会落下帷幕。本次大会聚集了来自世界上几十个国家的上千名科学家、CTO、企业家,及超过 6 万名从业者和爱好者,共同探讨数字经济背景下的 AI 未来。

“十年前,我们讨论的是云计算和大数据的萌芽,五年前进入移动互联网的大时代,站在十年展望未来,整个社会都在全面进入数字经济时代。”阿里巴巴董事局主席兼首席执行官张勇在主论坛演讲中说。

三年前,马云首次在云栖大会上提出“五新”,新零售、新制造、新金融、新技术、新能源。张勇表示,发展到今天,“五新”已经成了“百新”、“万新”,背后共同点正是各行各业都在全方位走向数字化和智能化。

此前,在阿里巴巴 20 周年庆祝晚会上,马云与张勇正式交接,卸任阿里巴巴集团董事局主席。但马云留给阿里巴巴和智能新经济这笔丰厚的 AI 资产,才刚刚被世人揭开冰山一角。

优胜劣汰,是必然的市场规律。

相比亚马逊、微软、IBM 和谷歌,阿里巴巴在人工智能方面起步较晚。在阿里 AI 产品还未成熟的时候,为了避免过早地被大众舆论拉入永无休止的信息战,阿里 AI 采用后发制人的策略,成立前沿技术研究机构达摩院,借助阿里云的竞争优势,以“云 +AI+IOT”模式展开云、管、边、端、AI、物联网的全链路、一体化布局,巧妙地在产品毛坯时期避开了各大巨头的炮火,在 2018 年之后接连斩获国际奖项。

接下来,我们将和您一起探讨阿里巴巴人工智能的经营策略、商业模式、技术优势、面临的挑战和未来思考,看阿里巴巴 AI 生态布局的步步为营。

01

从 iDST 到达摩院,阿里巴巴的 AI 布局 

达摩院是孕育阿里巴巴人工智能的技术沃土。2017 年 10 月,阿里巴巴在云栖大会宣布成立全球研究机构达摩院,研究对象涵盖机器智能、智联网、金融科技等多个产业领域,在机器智能、区块链、量子计算、自动驾驶等基础性技术领域进行深度布局。

iDST,数据科学与技术研究院是达摩院的前身,于 2014 年在硅谷成立,是阿里最神秘的部门。iDST 在推动阿里技术与业务融合过程中扮演着重要的中转站角色,肩负着马云“让数据驱动未来”的商业梦想。2014 年前后也是 AI 逐渐声名大噪的时期,现在榜上有名的 AI 独角兽大多是这一时期入场。

在达摩院机器智能实验室主任金榕看来,达摩院的设立主要有两个目标:一是把达摩院的 AI 基础能力(原子能力)放到平台上支撑所有现行业务,如阿里内部跟语音识别有关的业务全线使用达摩院的底层语音平台,但会根据具体业务做定制化的改变;二是上云,通过内部核心业务验证后,用户的接受度和满意度达到一定指标,产品上云商业化,进一步放大价值,服务整个社会。

经过两年的发展,如今的达摩院超过半数科学家具有名校博士学位,办公室分布在四个国家、八个主要城市,其中机器智能团队拥有 20 多位知名大学教授,近 10 位 IEEE FELLOW。马云希望阿里巴巴能够成为百年老店,希望达摩院至少能够活得比阿里巴巴要长。

在达摩院的推动下,阿里巴巴在 AI 平台、AI 算法、AI 引擎框架、AI 云服务、AI 芯片、产业 AI 等多个领域进入市场,以“云 +AI+IOT”的模式完成从单点系统到技术生态的全面布局。

图片来源:阿里巴巴官方

AI 云服务层:阿里云的人工智能集群包括 GPU、FPGA、NPU、CPU、超算集群、第三代神龙架构等在内的公共云服务,共同形成面向人工智能产业的支持。

AI 平台层:飞天 AI 平台、飞天大数据平台、AIOT 平台等大降低了 AI 开发门槛。其中,AI 飞天平台是国家首个云端商业化机器学习平台,支持上百亿特征、千亿训练样本的超大规模经典算法,降低 35% 训练成本,多个场景下提升 400% 训练速度,首创公共云上可视化建模,为开发者提供了接近本地开发的体验。

AI 算法层:达摩院在自然语言处理、智能语音、视觉计算等领域取得 40 多项世界第一。其中,自然语言处理在 SQuAD 机器阅读评比中精确阅读率首次超过人类,智能语音入选 MIT Technology Review 2019 年“全球十大突破性技术”,打电话语音客服机器人被认为是“比谷歌更好的语音技术”,世界计算可识别超过 100 万种物理实体。

从产业生态角度看,AI 技术本质上是一种底层的基础设施,发展早期一般由科学家的技术驱动。随着时间的推移,AI 产业生态布局进入稳定期,AI 技术全线植根原有体系架构,这个阶段最能体现团队的竞争潜力,革命性创新往往出自对市场深度洞察和具有领导力的团队。

从数据资产管理角度看,数据作为人工智能算法的重要燃料,是推动人工智能商业化的基础支撑,云计算的布局与分布式存储能够让人们更加方便、快捷地自助使用远程计算资源。这一过程中,计算云与存储云之间的数据传输积累了海量数据资产,为 AI 的算法和数据建模提供了丰富的数据资源,持续提升 AI 深度学习的效率。

02

阿里巴巴人工智能的竞争优势

阿里巴巴的核心业务可以分为四大板块:核心电商、云计算、数字媒体及娱乐,业务创新。其中,Gartner 数据显示,以 2018 年收入记,阿里云的行业地位是全球第三、亚太最大的基础设施即服务(IaaS)和基础设施公用事业服务提供商。

以 2019 财年(截止 2019 年 3 月 31 日的完整会计年)来看,阿里巴巴公司营收 3768 亿元,同比增幅高达 51%。云计算业务在 2019 财年收入 247 亿,同比增长 84%,自 2014 财年以来的 CAGR 为 100%,付费用户达 140 万;在 2020 财年第一季度收入 78 亿元,同比增长 66%。

据市值风云报道,阿里云服务在 2019 财年付费用户达 140 万,包含《财富》杂志评选的中国品牌 500 强当中超过半数中国品牌,也包含超过半数的 A 股上市公司。

阿里巴巴 CTO 张建锋认为“云 + 大数据”是构建很多行业的基础,没有这个基础,今后面向数字经济的条件都不具备;有了这个基础之后才能去畅想,才能有未来。

在本次云栖大会的演讲中,张建锋说:“今天大家都处于数据大爆炸的时代,数字经济非常重要的话题里,数据正成为一个核心的资源,也是核心的生产资料。从去年开始,阿里云也升级成为阿里云智能,我们不仅提供云的基础设施,也提供四大核心技术(阿里云、海量数据、物联网、移动化)综合性解决方案,这是阿里云接下去几年要去努力实现的事情。”

商用以小博大:以家庭大脑为抓手下沉生活场景

AI 作为阿里巴巴的新赛道,以“云 +AI+IOT”的方式深入云、管、边、端全链路布局,升级传统 AI 知识建模方式,在任务获取方面针对知识资源的特性进行相应调整和改变,驱动大数据分析与决策,为未来的万物互联打下基础。张勇在 2018 年致股东的一封信也指出,阿里也在为即将到来的物联网时代做着充分的布局和准备。

阿里巴巴副总裁、人工智能实验室总经理陈丽娟在本次云栖大会演讲中指出,无论世界变化多么快,前沿技术和家庭场景这两个趋势是大家一定要把握的,这也与马老师近期提出的“3H”战略不谋而合,即 Happy、Health、Home。未来的技术发展将不是以平台为中心,而是以家庭为中心,5G、IOT 时代变化的最终是为了实现更美好的生活。

陈丽娟表示,“家”是社区最重要的组成部分,是未来阿里“云 +AI+IOT”的重要落地场景。陈丽娟说:“家庭大脑既是神经中枢也是生态连接器,是未来社区的智慧引擎。”据陈丽娟介绍,阿里巴巴的“家庭大脑”由 AI、终端、人机交互系统三部分组成,综合家庭的碎片化、组织化特征以“家庭大脑”为抓手,实现用户的在线生活和云端定居。

作为阿里巴巴“家庭大脑”与实体世界进行人机交互的中枢,在本次云栖大会上,天猫精灵发布了基于人机交互系统 AliGenie4.0 版本的新品,包括语音技能平台、数字内容平台、IOT 接入平台、Inside 平台。与此前版本相比,AliGenie4.0 系统首次在智能音箱全领域实现了全双工自然对话技术,可以在播报内容的同时收听指令,一次唤醒即可进行多轮连续自由对话,并且可以随时打断;其中部分对话已经可以进行上下文感知,提升了自然语言连续对话能力。

在用户语音指令理解方面,AliGenie4.0 还在全球首次提出具有上线文感知能力的语音语义一体化技术,将下一轮文本识别语义理解的错误率降低了 58.5%。此外,新系统还支持方言识别和方言语音合成,目前已经能够识别四川话和广东话。

节点财经(ID:jiedian2018)获悉,搭载 AliGenie4.0 的天猫精灵也将成为首款采用阿里人工智能实验室和平头哥共同定制开发的智能语音芯片 TG6100N 的家用产品。

数字中台:城市级“云 +AI+IOT”解决方案

在本次云栖大会上,阿里云公布了城市大脑三年来取得的一系列进展:全球 23 个城市引入城市大脑,覆盖交通、城管、文旅、卫健等 11 个领域,48 个场景。工业大脑、农业大脑等一系列大脑的相继诞生,也加快了数字技术在众多领域的落地。

阿里巴巴中台事业群副总裁墙辉表示,为了支持数字浙江的建设,阿里目前正在将中台建设、运营中积累的一系列技术能力应用到政府领域。其中,业务中台支持所有业务相互连接,实现全局业务程序串联;数据中台实现数据的全面融合,把数据算法能力植入业务流程。

阿里巴巴副总裁、达摩院人工智能中心负责人华先胜也为我们分享了城市大脑助力政府数字化转型的实际应用。其中,城市大脑 AI 规模化实战技术——天谱、天曜、天机、天镜、天擎以及城市大脑 AI 计算平台,为数字经济社会的未来发展提供解决方案。

在过去几年,依托阿里“云 +AI+IOT”的应用能力,先后为鑫光伏、天合光能、协鑫集成、徐工集团等大型制造企业提供服务。在物联网专家杨勇看来,基于阿里云可以轻松安全地将设备连接至云,从边缘设备到云端,从各种设备上收集数据、分析数据,帮助制造业提高运营效率,如阿里云 ET 工业大脑进入协鑫光伏切片生产车间,生产良品率已经提升 1 个百分点,每年可节省上亿元的生产成本。

此前,在 2018 年广东云栖大会上,阿里云发布了“飞龙互联网平台”,提出通过新平台,助力数字广东实现云未来。

芯片布局:站在 AI 独角兽背后

阿里巴巴人工智能的对外投资主要聚焦细分领域头部企业,围绕各行业的硬核科技布局 AI 整体生态。目前,AI 独角兽商汤、旷视、依图和寒武纪背后都有阿里的身影。

图片来源:节点财经

值得一提的是,在 AI 芯片领域,2017 年阿里投资了深鉴科技、寒武纪;2018 年 4 月,阿里收购唯一拥有自主嵌入 CPU IP Core 的国产芯片公司中天微,成立 AI 芯片自研团队;2018 年 9 月,据新浪科技报道,阿里巴巴 CTO 张建锋宣布,阿里把此前收购的中天微和达摩院自研芯片业务整合成“平头哥半导体有限公司”推进云端一体化的芯片布局,其思路是先期让阿里云服务器用上自己的芯片,后期开放给行业做普惠。

在本次云栖大会现场,阿里巴巴发布了第一颗自研 AI 芯片——含光 800。这颗芯片是一款 AI 推理芯片,主要用于云端视觉场景,可为业界提供强大 AI 推理算力。张建锋表示,全球芯片领域阿里巴巴还是一个新人,玄铁和含光 800 是平头哥万里长征的第一步,未来来有很长的路要走。

含光 800 性能的突破得益于软硬件协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院的算法,针对 CNN 及视觉类算法深度优化、计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。

根据现场演示,城市大脑处理杭州主城区交通视频,需要 40 颗传统 GPU,延时为 300ms,使用含光 800 仅需要 4 颗,延时降至 150ms;拍立淘商品库存每天新增 10 亿商品图片,使用传统 GPU 算力识别需要 1 小时,使用含光 800 后可缩减至 5 分钟。

目前,云计算、大数据、物联网、移动互联网与 AI 的发展与融合已经成为不可阻挡的趋势。相比互联网产业,传统产业的革新对技术的需求更为庞大,涉及的产业链更长,但是,传统产业对新技术的应用以及 IT 能力良莠不齐,复杂的需求和巨大的资源消耗也为 AI 商业化落地提出了不容忽视的高标准、高性能、高要求。

03

阿里巴巴人工智能面临的挑战

阿里 AI 这五年,背后是达摩院这群科学家们的执着与付出。达摩院人工智能中心负责人华先胜表示,阿里巴巴人工智有今天的成绩,也有诸多的挑战。

商业化营收:实验室结果与真实世界的割裂

华先胜博士调侃道:“实验室的结果和真实世界是两回事,如果把实验室的结果当成是真实世界,那出了实验室我们基本上都要怀疑人生了。”

据内部人士回忆,在 iDST 运营的早期,科学家们脱离业务线只做纯粹的基础技术研究,使得 iDST 上下的研究缺乏目的性,很多人也不知道自己的算法、模型要解决哪些具体问题,从研发到落地出现了巨大的断层。为了寻求商业场景让科学家们深入一线,在 2015 年 7 月,iDST 的人马进行了调动,蚂蚁金服总裁胡晓明受命,带领这群搞研究和搞学术的下一线深入场景、接触业务,并且科学家、研究员下一线接触业务已成为传统沿袭至今。

那么,为什么说实验室结果与真实世界是两码事?

业内讲,搞研发只考虑前沿技术的可实现,不考虑未来商业的生产成本。因此,科学家们造出的第一级产品往往都不接地气,到真正的商业级应用还有相当大的一段距离。并且,这些问题客观存在于从科研到商用供应链的每一个环节中。这就意味着,阿里 AI 将持续面对“高额研发成本支出与收益回报不成比例”这一挑战。

竞争对手:虎狼环伺、新贵入局、竞争加剧

从全球范围的智能云服务领域看,除了阿里云,这一领域的主要玩家有亚马逊的 AWS、微软的 Azure,谷歌、IBM、Oracle 等。从市场角度看,市场表现出对企业聚焦 TOB 业务带来的营收和综合抗风险实力提升的认可,对潜在价值的挖掘表现出较高预期。

据市值风云报道,公有云当前大约 2/3 的市场份额被前五大厂商瓜分:亚马逊、微软、IBM、谷歌以及阿里巴巴。据 Synergy Research Group 数据,截止 2018 年第三季度,亚马逊 AWS 市场份额为 34%,微软 Azure 市场份额为 14%,IBM 和谷歌各占 7% 左右,阿里巴巴 4%。

得益于产品、团队和相对熟悉的服务场景,阿里云多年积累的客户关系、品牌口碑、以及自身的研发体量,都决定了公司得以在短期内取得优异成绩。但是,后续的商业战场将呈现出强敌虎狼环伺、新贵潜在对手弯道超车的局面。无论是云计算领域的原住民还是行业新贵,都将开始加码投入云服务建设,可以预见未来竞争市场竞争的激烈程度。

从阿里巴巴本身来说,未来阿里云和 AI 的权重将继续加大,对这方面的营收要求将会持续体现在公司层面的成本管控和利润率方面。因此,越是强调开源,强化对技术生态环境的完善,越是能够加速人工智能的商用落地。

数字资产:坐在金山上啃馒头,也很难吃成胖子

“坐在金山上啃馒头”是达摩院金融智能实验室负责人漆远加入 iDST 时听马云说过的话。金山就是阿里巴巴拥有的丰富数据资产。但是,即便是坐拥金山啃馒头,也难以一口吃成个大胖子。“如果数据的价值不能被挖掘出来,那不过就是普通的土壤。”

自 1946 年第一台计算机诞生,人们一直希望计算机能够具有更加强大的功能。随着深度学习理念的复兴,计算能力的提高和大数据的积累,人工智能的发展突飞猛进,不仅创造一些新行业,也给传统行业赋能。今天,劳动工具转向了基于数据、信息、知识、价值和智能的智力工具。

阿里巴巴开源技术委员会负责人贾扬清认为,人工智能的深度学习,10% 是 AI,90% 是大数据。从技术角度讲,云计算是基础,AI 是内核,数据是燃料,人工智能的八项技术——知识图谱、搜索技术、群智能算法、机器学习、人工神经网络与深度学习、专家系统、计算机视觉、自然语音处理与语音处理的背后都是大数据的集成处理与决策应用。

To C 的云计算、大数据、AI 服务,与 To B 服务存在诸多差异,如用户需求、基础设施建设、解决方案的通用性等。阿里巴巴的核心电商业务为阿里 AI 积累了丰厚的 C 端数据资产,相比之下,阿里在 B 端和 G 端的解决方案,如城市大脑的全链路、更大规模、更多维度的数据集成,应用时间还比较短,算法和算力的成熟度并不能与 C 端服务相提并论。

真假刚需:“玩一下”与“离不开”难辨真伪

“用户玩一下的层面的需求,是个假刚需。”华先胜博士在演讲中说:“只有真正的刚需,才能有效训练机器。”

业内人士称,现在几乎 90% 的人工智能公司都采用项目制的形式摸索着做项目,这就需要对真假刚需做判断。碰上“玩一下”就是假刚需,对团队是真消耗,碰上“离不开”的真刚需,才能推动团队产生正向的收益。

用户玩一下,既没有办法沉淀数据,积累的数据量又不能摸索出算法规律去训练机器;离不开式的人机交互可以持续锻炼机器智能。随着用户对 AI 的持续使用,用户需求升维,机器也将受到不同程度需求导向式的训练。比如,某语音识别产品的词汇包当下的词汇量是 140 万个。随着用户使用频次的提升和使用场景的更换,用户开始对产品提出更多维度的语音识别使用要求,词汇拓展量需要扩容到 200 万个,而当下该产品的技术并不能达到用户心目中的标准,这种反馈机制会推动产品根据用户需求持续迭代,从而完成对机器的有效训练。

从目前的市场现状来看,“玩一下”这样的项目没有办法产生有效的现金流。但“玩一下”和“离不开”的需求都在需求池里面,在没有经过市场检验前,谁也不知道自己的项目是“玩一下”还是“离不开”。与此同时,更大规模、更多维度的大型人工智能应用、灾备处理和预测预警,从目前的人工智能技术成熟度来看,仍旧存在大量应用不了的场景和落地不了的解决方案。

此外,在资本层面,未来的独角兽和新百亿市值公司如何突围,也将是创投领域持续关注的焦点。

随着人工智能技术在产业互联网场景深度下沉,AI 技术在基础层、技术层和应用层迎来全新挑战,考验着玩家的研发、管理、培训、商业化等各方面的综合竞争实力。未来,如何借势国内外巨头们建成的基础架构、利用现有生态去实现更多的创新生产、逐渐提高行业效率改进实施流程,需要阿里 AI 技术研究机构多维度、多角度的思考与探究。

04

人工智能产业发展的未来思考

随着产业互联网的深入发展,信息构成的数字世界和人类生活的实体世界将会进一步互融互通。在产业互联网的江湖里,成长都是指数级的,没有谁可以真正的高枕无忧。与时俱进、尊重用户体验是互联网产品的金科玉律。

对于人工智能产业的未来发展,节点财经(ID:jiedian2018)有以下三点思考。

第一,强化数据资产的安全保护。

产业互联网时代,实体行业的生产属性意味着更大规模与更多维度的节点数据,涵盖物流、资金流、信息流与服务流等商业全流程。对生产数据的聚合分析将从业务洞察发展为业务决策,梳理统一与单一化模型分析将不能满足企业在实际应用场景中的数据应用需求,这对数据资产安全管理提出了更高的要求。

资深互联网安全专家张辉文告诉节点财经,数据资产安全保护已经上升到了法律层面,只要涉及到用户数据就需要考虑网络安全法,就需要实施等级保护。2018 年 1 月由国务院办公厅发布的《科学数据管理办法》中,明确了科学数据的责任、安全使用和共享利用等行为规则。政策层面的关注也表明,可续数据是国家科技创新发展和经济社会发展的重要基础性战略资源,科技创新越来越依赖于大量、系统、高精度的科学数据。

张辉文表示,产业互联网数据安全发展面临的核心问题是“人的问题”,急需关注由人引发的操作风险。无论技术进化到何种程度,做最后决策的是人,最复杂的因素也仍然是人。从目前全球数据安全环境来看,诸多国内外安全事故的原因都来自运维工程师的违规、升级补丁等操作。如,谷歌、亚马逊等国外云服务商都从曾因为运维人员操作不当出现过大规模宕机的问题。此外,某国外银行的用户个人信息泄露事故,也需要引起国内厂商对安全管控的重视。

从 AI 技术安全角度来看人工智能的未来发展,张辉文认为,深度学习模型需要安全加权和安全性方面的持久练习,未来希望在各主管部门、行业领先企业的带动下,产业能够形成 AI 数据资产安全保护的标准化制式,为 AI 技术长远发展找到最安全的落脚点,最终回归到数据安全维度保护用户隐私和财产安全。在维护数据资产安全,需要企业做正确的决策,推动产业建立秩序、合规发展。

第二,做好城市级服务的发展规划。

在《2019 城市商业魅力排行榜》中,一线城市和新一线城市聚集了全国 80.17% 初创公司,56.63% 是高新科技型公司,54.55% 的上市公司和 67% 的创业平台,并吸引了高达 96% 的创投基金的资金流入。

城市群创新氛围的竞争中,头部城市在这些指标中的表现至关重要。京津冀城市群的北京,仍是全国创业氛围最佳的城市之一;在长三角城市群里,上海、杭州、苏州、南京、宁波、合肥等城市是“未来化”发展的创新核心矩阵,数字经济、城市级服务、高新技术产业园区的建设、人才引进,都将在新的未来城中开启产业变革。

综合分析,珠三角、京津冀、长三角基本代表了当前城市群的“未来感”先头部队,这三个城市群内的城市未来可塑性平均值大幅领先于其他城市群,也将是“云 +AI+IOT”解决方案城市级应用的重点部署区域。

第三,产业创投既要投战略也要投人才。

AI 技术的跨越式发展需要具备前瞻性的思考,AI 技术也会因为产业生态所处的不同阶段、用户需求的不断变化去应对各种未知的挑战。当 AI 技术处于瓶颈期时,需要企业运用资本运作和自身力量,寻找合作伙伴形成强有力的生态矩阵去弥补技术维度上的不足,或通过多种技术的结合,与合作方进行相关的并购整合将单点集成为系统,增强整个产业生态的技术壁垒。

可以预见的是,行业之间的界限会越来越模糊,跨界整合将会越来越多。这就意味着,“人”将在未来的科技创新和产业变革中占据更加重要的位置。对于人工智能产业投资,既要战略入股有可塑性的企业,又要投资相关的技术人才,为未来的人工智能产业的全面爆发储备力量。