华为达芬奇计划揭露AI全面走向自研,核心架构来自外部还是自有

美国网站 The Information 在上周透露一则信息,那就是华为也要追上中国厂商推动 AI 芯片自制的潮流,推动全名为达芬奇计划(Project Da Vinci)的 D 计划。

该计划包含了几个重要信息,那就是华为要面向发展数据中心的 AI 芯片,取代华为目前使用的 NVIDIA 方案。而该计划的主导者是华为轮值董事长徐直军,他同时也是华为旗下 IC 设计公司海思半导体的董事长。

华为目前的云端计算服务主要使用在城市安保方面的工作,包括监控摄像机的数据收集与分析,而今年初华为则是推出 SoftCOM AI 解决方案,目的是在全云化网络基础上引入 AI 技术,实现网络的“自动驾驶”。

SoftCOM AI 解决方案的具体做法是:把下层设备和云基础设施、中间层的网络管理和控制以及上层全流程的系统,在规划、部署、运行、维护、优化和经营的端到端过程中,每一个环节都引入人工智能技术,使网络达到系统最优。与此同时,华为也构建了一个面向运营商的 AI 训练平台,将网络设备运行的状态数据接入平台来训练 AI 模型,并针对模型进行持续更新和优化,使得网络系统的自动化程度不断提高。

而华为在城市安保与云端网络 AI 管理方面的核心都是使用 NVIDIA 的方案,而一直以来,NVIDIA 与华为都有著紧密的合作,但为何要在这个时间点宣布自有 AI 方案,甚至根据信息来源,D 计划的主要目的就是要取代 NVIDIA 的云端 AI 计算方案,应该与来自美方的压力有关。

中国行业巨头纷纷走向自研,但华为可能更为急迫

其实,华为进入自有架构发展已经算晚了。在华为之前,百度、阿里巴巴都已经先后宣布自有 AI 芯片的布局,百度的昆仑芯片使用自行设计的架构,虽然芯片还在设计阶段,但该公司宣称其理论算力要高出 NVIDIA 的方案一倍以上。

阿里巴巴则是宣布将投入 Ali-NPU 神经网络芯片的研发,该架构不提绝对性能,而是强调其超高性价比,号称超越传统 CPU/GPU 架构达 40 倍。腾讯虽然还没有宣布其自有 AI 芯片的布局,但其之前曾投资 VoxelCloud(体素科技)、碳云智能、真时科技以及蔚来汽车等企业,发展方向以 AI 的行业应用为主,与其他公司不同。

这些公司的 AI 布局主要都集中在云端计算方面,而华为的 D 计划同样也是针对云端计算而来。

但华为推出自研云端 AI 方案,明显是针对 NVIDIA 而来,但 NVIDIA 过去与华为合作紧密,为何在这个时间点传出自研消息,应该与之前美国在讨论其紧急权利法案,要对高科技方案进行输出限制时,明显提到华为与 NVIDIA 的合作的关系。

图|NVIDIA 在 2017 年 9 月与华为合作发布服务器计算方案。

NVIDIA 否认其与华为有分享芯片核心层级技术,主要还是在方案的合作上,但是在被美国政府点名,以及近来华为从电信设备到移动通信产品,都在欧美市场遭到阻碍的状况下,加上中兴的前车之鉴,华为才决定加速整个计划的推动。

寒武纪还是 Arm 架构将入选?或是从头打造?

而要在这么急迫的时间推出可用方案,如百度或阿里巴巴完全走向自研虽仍有可能,但若采用现有可选方案比较有可能在短时间内实现。

若以此为前提,那目前可选的方案有两种,分别是寒武纪或 Arm 的 AI 方案。

寒武纪在今年 5 月推出了包含 IP 与芯片产品,分别是寒武纪 1M,以及 MLU100。

寒武纪 1M 延续了前代 1H/1A,可支持 CNN、RNN、SOM 等多种深度学习模型,此次又进一步支持了 SVM、k-NN、k-Means、决策树等经典机器学习算法的加速。这款芯片支持帮助终端设备进行本地训练,可为视觉、语音、自然语言处理等任务提供高效计算平台。而寒武纪 1M 也是款可扩展规模的核心,可通过多核配置来达到更高的性能表现。

而 MLU100 则是芯片方案,采用寒武纪最新的 MLUv01 架构和 TSMC 16nm 工艺,可工作在平衡模式(主频 1Ghz)和高性能模式(1.3GHz)主频下,等效理论峰值速度则分别可以达到 128 万亿次定点运算/166.4 万亿次定点运算,而其功耗为 80w/110w,能效极高。

华为即将在今年推出的麒麟 980,传言将采用寒武纪 1M。那么云端 AI 计算使用 MLU100,或是利用 MLUv1 架构深度定制化也是有可能。

另外,Arm 与中国合资成立 Arm mini China,除了提供更完整的服务,同时也扫除未来 IP 授权业务可能受到的外来因素干扰。

图|Arm 所推出的机器学习芯片方案。

Arm 在今年推出 ML 处理器方案,可在 7nm 工艺下以标准规模设定达到 4.6TOPs 的操作性能表现,每 W 可达 3TOPs 的能效,具备相当的竞争力。而 Arm 也强调他们的架构都可规模化定制,换言之,理论上客户需要什么等级的性能表现,就可以把规模扩充到所需要的程度,当然,规模的增加也代表功耗和成本的同步增长。Arm 虽强调其可扩充能力,但谈到可否将规模加大到与主流用于云端 AI 计算的 GPU 架构相提并论,仍语带保留。

而华为作为 Arm 传统忠实客户,Arm 也积极向华为推销相关的 AI 方案,业界也同样传出麒麟 980 可能改用 Arm 的 AI 方案的声音,云端 AI 方案 Arm 亦是可能选项。

而最后的可能性,就是华为放弃寒武纪与 Arm,采用全新研发的架构,但是在生态方面,寒武纪支持了主要框架的大部分算法模型,而 Arm 也花了数年的时间研发了 Arm NN 这个可以桥接大部分框架与算法模型、并可动态分配至 Arm 计算架构上进行计算工作的软件环境,芯片本身可能相对容易搞定,毕竟 AI 计算所需要的结构大同小异,除非搞光量子或者是深度神经网络计算架构,否则不会有太多意外的地方。但是在框架与生态的建构上,华为一时半刻还无法复制寒武纪以及 Arm 的工作。

而若要在短时间内取代目前业界拥有最强大生态支持,以及最完整软硬件环境的 NVIDIA,不寻求外力支持恐怕不太现实。

当然,在消息披露之后,华为并未对 D 计划内容进行回应。

实际上,国际市场对华为之所以戒慎恐惧,主要是因为华为虽然使用不少国外元器件,但核心部分通常都经过大幅修改,比如说电信设备,或者是智能手机的软件部分,就好像产品中藏了“黑盒子”,加上华为的背景,自然容易被严格检视。

而如果在云端计算同样采用自有架构来取代 NVIDIA 方案,那等于是增加了更多神秘的部分,当然,对华为而言是可以降低核心来源被中断的风险,但是就市场而言,以更不成熟的方案来替代,加上自有的部分比重增加,那可能同样会增加未来出口的困难度。

未雨绸缪是好事,但仍要考虑技术层次、生态经营,以及可能的市场挑战,自有只是手段,也不应该是最终目的。