Intel 砍掉 Nervana AI 芯片、力推 Habana Labs

英特尔提到决定大力推进 Habana Labs 的 AI 芯片以取代 Nervana 时说:“通过改用单一的硬件架构和软件堆栈以实现数据中心 AI 加速,我们的工程团队可以携起手来,致力于为客户更迅速地提供更多的创新。”

Habana Gaudi 芯片是为训练神经网络而设计的,包括支持 ROCE 以实现远程存储访问的片上 100Gb 结构。

英特尔表示,现停止开发其 Nervana 神经网络神经处理器的工作,改而将重心放在因最近斥资 20 亿美元收购 Habana Labs 而获得的 AI 芯片。

加利福尼亚州圣克拉拉的这家公司周五表示,它已停止开发 Nervana NNP-T 训练芯片(代号为“Spring Crest”)的工作,会兑现目前在 Nervana NNP-I 推理芯片(代号为“Spring Hill”)方面向客户许下的承诺,以便大力推进 Habana Labs 的 Gaudi 和 Goya 处理器,以取代 Nervana 芯片。

英特尔在一份声明中说:“Habana 产品线提供了同时面向推理和训练的统一高度可编程的架构所拥有的强大战略优势。通过改用单一的硬件架构和软件堆栈以实现数据中心 AI 加速,我们的工程团队可以携起手来,致力于为客户更迅速地提供更多的创新。”

英特尔在去年 12 月份中旬宣布收购 Habana Labs 后,当时分析师就质疑这家芯片制造商会不会继续推进 Nervana。宣布这笔收购交易仅仅一个月前,英特尔在 11 月份披露了其 Nervana 芯片的更多细节,它推出这款芯片是为了应对这一窘境:英伟达的 GPU 在 AI 加速市场不断扩大地盘。自 2016 年斥资 4.08 亿美元收购 Nervana 公司以来,英特尔一直在开发 Nervana 芯片。英特尔的 AI 平台事业部负责人 Naveen Rao 是 Nervana 的联合创始人之一。

英特尔表示,它是在征求其工程师和大客户的反馈之后做出这一决策的,将充分利用“合并的 AI 人才和技术来制造领先市场的 AI 产品。”反馈表明,代号为 Spring Hill 和 Spring Crest 的第二代 Nervana 设计根本满足不了那些高性能工作负载的要求。这些客户提到 Habana 是可与英特尔一较高下的优选平台。特别吸引英特尔的地方恐怕是这一点:Habana Gaudi 芯片采用一种片上 100Gb 以太网结构,支持基于融合以太网的 RDMA(ROCE)。由于支持 ROCE 的迈络思网卡每块卡成本远超 1000 美元,英特尔现在终于会有这样一款芯片:可以低成本扩展至数千个节点的规模,以处理自然语言处理等应用中所使用的新兴超大神经网络模型。要知道,迈络思已被英伟达斥资 68 亿美元收购。

现在,Nervana 的产品经过一再推迟和多次易名后,英特尔对 Spring Crest 已完全不抱希望。不过,Spring Hill 还没有完全死掉。我们获悉,已订购这款神经网络运算加速器芯片的客户仍可以拿到该芯片。这让我们不由想到了至强 Phi 系列的命运。

英特尔称:“我们将用英特尔的 AI 软硬件创新来夯当前一代和下一代的 Habana Goya 和 Gaudi。这一路线图决策符合英特尔的 AI 战略,也符合我们的承诺,即竭力提供使用场景从智能边缘到数据中心的异构 AI 解决方案,以满足客户不断变化的功能和性能需求。”

虽然 Habana 将成为英特尔 AI 战略的旗舰处理器,但 GPU 仍在其数据中心战略中占有一席之地,因为 GPU 灵活得多,而且加以编程后可为众多应用提供加速功效:从机械工程分析到天气预测,不一而足。所以简而言之,英特尔需要推出一款名为 Xe 的数据中心 GPU,将用于阿尔贡国立实验室的第一台百亿亿次(Exascale)超级计算机——英特尔计划这么做。

可以这么说,像 Facebook 这样的客户已向英特尔明确表达了其观点:你需要获得一种更好的芯片。对于英特尔来说,收购 Habana 后仍坚持不放 Nervana,为的仅仅是挽回面子,这毫无意义。英特尔旗下已经有至强、Altera、MobileEye、Movidius 和即将推出的 GPU。有些东西得有所舍弃,那就是 Nervana。所以没错,这是英特尔作出的一个明智而大胆的举措,那样它才能在迅猛发展的 AI 加速领域为自己打造未来。

去年英特尔斥资 20 亿美元收购的 AI 硬件初创公司 Habana Labs 以训练芯片和推理芯片(分别是 Gaudi 和 Goya)著称。不过与 Nervana 不同,这家以色列初创公司向市场推出产品方面一向很成功。

简而言之,Habana 赢了,Nervana 输了。