华为AI里程碑?最强算力AI芯片发布全新计算框架欲一统端边云

8月23日下午,华为于深圳召开发布会,宣布其自研的 AI 芯片昇腾 910 正式上市商用,并发布了 MindSpore 计算框架。

本次发布会是华为对于人工智能战略成果的延续,华为从各个方面回顾这一年的发展的同时,也表示看好 AI 对未来社会发展的推动作用。在起推动作用的时候,AI 有两个必不可少的条件:AI 处理器和 AI 计算框架,这也是本次发布会的两个主要内容。

(来源:华为)

华为副董事长、轮值董事长徐直军介绍,昇腾 910 是目前单芯片计算密度最大的芯片,计算力远超国际同类产品。测试结果显示,910 的半精度为 256T,整数精度 512T,同等功耗下算力资源相当产业平均水平的 2 倍。更重要的是,达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。

对此,徐直军表示:“昇腾 910 总体技术表现超出预期,作为算力最强 AI 处理器,当之无愧。我们已经把昇腾 910 用于实际 AI 训练任务。比如,在典型的 ResNet50 网络的训练中,昇腾 910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升”。

而 MindSpore 计算框架,则是与昇腾系列配套诞生的一个旨在统一端边云的 AI 计算框架。随着昇腾 910 和 MindSpore 计算框架交出成绩单,徐直军宣布,华为已完成全栈全场景 AI Portfolio 构建,也标志着华为 AI 战略的执行进入了新的阶段,“华为的 AI 业务达成了新的里程碑”。他也表示,今年的 516 美国打压事件没有对华为的 AI 战略、研发和商业化产生影响。

对于 DeepTech 提问的“未来 AI 芯片会不会成为独立业务”,徐直军表示,昇腾芯片不会以独立芯片面向市场,不仅如此,华为未来还希望和大量 AI 芯片企业探讨合作多种场景的开发,所以说“AI 芯片作为独立业务不会发生,也不还是新的阶段”。

图丨华为 AI 解决方案(来源:华为)

华为一直视智能计算为重要产业,过去一年也正好是华为智能计算战略升级后的一年。对于智能计算,华为认为,未来智能将无所不在,涉及生活的方方面面,智能计算产业的发展和人工智能战略是一脉相承的。这次发布会发布的两款产品,也正是华为认为的智能计算产业最重要的两个组成元素。

芯片+计算框架“双重出击”,意味着华为在智能计算上有了更为完备的 AI 基础设施能力。华为认为,当前者代表的算力朝着多元化方向演进,后者代表的开发体验,却相反地走向统一。

算力走向多元化:为云而生的昇腾910芯片

作为华为自研 AI 芯片中的“排头兵”,昇腾系列芯片自诞生起便承载着覆盖“全栈全场景”的使命。

发布会上,徐直军再次表示,华为提出的全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。而全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。

图 | 910 芯片(来源:华为)

昇腾系列在华为的全栈方案负责提供最核心的算力支持。昇腾 910、昇腾 310 的首次亮相是在去年 10 月的华为全连接大会上。其中昇腾 310 主打终端低功耗 AI 场景,拥有 8 TFLOPS 半精度计算力,最大功耗为 8W,采用 12nm 工艺,在去年 10 月已经量产。昇腾 910 主打云端高算力的 AI 计算场景,将组成大规模分布式训练系统 Ascend 集群,包括了 1024 个 Ascend 910 芯片,算力可以达到 256P,大幅超过英伟达 DGX2 和谷歌 TPU 集群。据悉,基于昇腾芯片的华为云系列 AI 云服务也即将在 9 月上线。

据徐直军介绍,基于 310 的产品和云服务已经有了广泛应用,包括移动数据中心 MDC、系列板卡和服务器、基于 310 的华为云服务。

据 DeepTech 现场了解,昇腾计算平台已经开始支撑华为诺亚方舟实验室开发的最新自动驾驶算法。

昇腾系列之所以称之能够“覆盖全场景人工智能”,是因为系列芯片虽然看起来只是一颗小小的芯片,但其实是一个微型系统,其内部集成了 AI 处理内核、鲲鹏内核,及编解码芯片等其他功能独立的部件。通过这些内部部件对外提供通用的 AI 算力,昇腾芯片可以应用在不同的场景。

图 | 310 芯片(来源:DeepTech)

其中,芯片搭载了自研的达芬奇架构,简单而言就是 AI 的计算加速器,能够使得芯片有更好的性能。昇腾系列 AI 芯片的一大亮点在于采用了华为自研的“达芬奇架构”。该架构具有相当的可扩展性,能够覆盖从低功耗到大算力的计算场景,而且可以实现一次开发适用于多个场景的部署、迁移和协同,对于软件开发来说能够提高效率,加速应用的落地。

自研的达芬奇架构面世,也是一个对于国内人工智能领域是一个重大里程碑,这也是系统厂商自研芯片策略的终极展示。

在进入人工智能时代后,由于应用场景的多样化和复杂度,自研芯片的能力代表着技术竞争力的门槛能堆砌多高。因此,这场人工智能战役基本上不会有大型系统厂缺席,同时,华为这种掌握硬核科技实力、拥有普惠 AI 抱负的系统大厂,基于其 AI 战略的真正投入和实施,相信将对整个中国 AI 产业发展带来推动作用。

根据华为规划,基于达芬奇架构的昇腾芯片分为 Max、Mini、Lite、Tiny、Nano 五个系列,除了昇腾 910(Max)、昇腾 310(Mini)之外,另外三个系列 Lite、Tiny、Nano 分别是瞄准物联网、智能手机、智能穿戴等终端场景,以 IP 和芯片搭载的方式嵌入于不同产品中,真正达到全场景覆盖。

图丨达芬奇架构(来源:华为)

算法开发体验走向统一:MindSpore 协同端边云

AI 时代,计算场景的多元化也带来了不同的算力需求。

但和 AI 芯片走向应用定制化、针对场景优化不同的是,计算框架作为 AI 实现功能的基础设施之一、作为承接底层硬件和上层应用算法的承上启下部分,应该是可以在云、边、端上提供统一开发体验的。

目前的深度学习框架可谓各据山头、各自为战,谷歌的 TensorFlow、FaceBook 的 PyTorch 等等。DeepTech了解到,对比来看,华为的研发人员也曾用过这些热门的计算框架,整体可用性好,但是往往只能实现单个领域的落地或者研究,如果应用到企业生产中还要考虑数据隐私、数据合理分布,必须实现端-边缘全场景支持。但是支持之后,可能又像谷歌的 TensorFlow 计算框架一样有两个版本两套代码。能否用一套代码实现这些功能,同时避免数据隐私问题?

具体而言,针对企业需要和社会需要,计算框架应该能够支持端-边缘计算,云上计算;针对 AI 泛化难的问题,计算框架应该能帮助各领域的科学家专注于各自的研究。

由此,MindSpore 作为支持端、边、云独立的和协同的统一训练和推理框架登场,并于昇腾系列芯片相配套,满足终端、边缘计算、云全场景需求。

(来源:DeepTech)

徐直军介绍,该计算框架大大降低 AI 应用开发的门槛,将帮助实现 AI 无处不在,同时在任何场景下确保用户隐私得到尊重和保护,“但华为并没有看到已有的框架可以做到这一点”。

目前 AI 已经不单单是计算机或者数学的单学科领域,而是一个交叉学科综合的领域。例如现有的计算框架下,数学家既要关注数学还要关注计算机科学,导致科学家不能专注于自己的领域。这就要求 AI 计算框架能满足各个领域的科学家完成相关的研究,协助他们进行探索和创新。本次发布的计算框架将是世界上唯一一个能实现端边云协同的计算框架。

徐直军表示,以一个 NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,开发门槛大大降低,效率整体提升 50% 以上。通过 MindSpore 框架自身的技术创新及其与昇腾处理器协同优化,有效克服AI计算的复杂性和算力的多样性挑战,实现了运行态的高效,大大提高了计算性能。除了昇腾处理器,MindSpore 同时也支持 GPU、CPU 等其它处理器。

为了更好促进 AI 的应用,徐直军宣布“MindSpore 将在 2020 年 Q1 开源”,助力每一位开发者,促进 AI 产业生态发展。

华为研发人员对 DeepTech 介绍,本次发布的计算框架同样基于华为多年来的 AI 研究。华为瞄准的是未来 AI 多领域综合发展的目标,在目前还没有任何计算框架能解决华为在相关研究中的难题的时候,自研又成了华为的“本能动作”。

从芯片到算法,从软件到硬件,华为的智能计算战略之下,更多的野心正在显山露水。

图丨华为 AI 芯片商用情况(来源:DeepTech)

华为“造芯”简史

华为在 2018 年引领了手机配备AI芯片的风潮,如今昇腾系列也正式落地,但其实,华为“造芯”的起家要追溯到上个世纪的 90 年代,那是全球电子产业蓬勃发展的时代。

那个时候,张忠谋与台积电开创了半导体的新时代,半导体代工厂的出现,将芯片设计和生产分开,为初创企业开辟了生存空间。

从此,出现了“Fabless Design”这一词汇,即无晶圆设计。初创公司只需要设计芯片再找台积电等半导体代工厂代工,就能产出自己的芯片。如今活跃于中国国内电子市场的众多大型企业,也是在那时候得到发展机会,例如联想当时自主研发了五颗 ASIC(专用集成电路芯片),并成功地应用于汉卡、微机和汉字激光打印机。

华为,也是赶上了这一班车,任正非开创了自己的芯片部门,招来了当时来深圳打拼的首批中国芯片人,整个企业从代理战略转型,走到制造业的一线开始打造自己的产品。当时的华为瞄准了通信应用的交换机作为主营业务。而交换机作为通信应用中十分重要的设备,能有效提高通信效率,能够替代“接线生”进行长期稳定的工作。

1991 年,第一次流片即宣告成功,华为拥有了首枚自主知识产权的芯片,而这就是华为芯片的起点。不过这块芯片没有如今“麒麟”“昇腾”这么响亮的名字,就叫“ASIC”。也正是这样质朴的名字,为华为芯片刻下务实、扎实的烙印。

开发完第一块芯片,华为尝到了甜头,为了更加独立自主地进行芯片研发,华为花大价钱从国外买来了 EDA 工具,从此有了自己的 EDA 设计平台,不用再委托香港公司。但是由于半导体生产成本太高,华为还是走轻资产的 Fabless 路线。

图丨华为 C&C08 机柜

于是,华为开始筹备下一个产品,他们瞄准了交换机的整机设计,而其产品就是数字程控交换机 C&C08。这是一个里程碑式的产品,在当时性能已经超越其他竞争对手,成为市场上的主流机型。C&C08 的成绩单相当亮眼:1994 年,C&C08 销售达到 8 亿元,1995 年达到 15 亿元,到 2003 年,累计销售额达到千亿元,成为全球销售量最大的交换机机型。

第三个节点,在于 2004 年海思(Hisilicon)的成立。华为开始做消费电子芯片。华为早先就意识到手机等消费电子兴起的趋势,而这个市场也是巨大的,不像交换机这种大型设备,需求比较垂直,消费电子的需求要更加复杂,面向的消费者也是多元的。时至今日,无论外部怎么抑制,华为的芯片都已经无法掩盖其光辉了,这和华为海思的消费电子芯片开发分不开,它成功地为华为开辟的第二战场保驾护航。

我们如今津津乐道的华为 5G 技术仿佛改变人类社会近在眼前,不过在十几年前的 3G 网络还是在高通公司(Qualcomm)的统治下,凭借在 CDMA 领域积累的专利在全球遍收“高通税”,TI、英伟达、博通、ADI、意法半导体、飞思卡尔以及爱立信等大厂都因为没有基带处理器(BP,Baseband Processor)技术,不得不向高通低头。其中,基带处理器的功能是负责移动终端信号收发、处理各种通信协议。一句话,如果没有基带处理器,你的手机就连不上网络,发不了短信,成了一部砖头,而它也被公认是移动通信领域最硬的骨头。

然而,华为走的一直就是打破垄断和独立自主的研发道路,在这里不得不提到的一个人就是王劲。2007 年底,已经成为欧洲研发负责人的王劲回到上海,组建横跨海思和终端公司的无线芯片团队,开始研发移动通信的核心器件——基带处理器。需求推动技术发展,王劲及其团队成功研发出芯片,并以位于珠穆朗玛峰西北的雪山“巴龙”命名,称为巴龙(Balong)700,象征着华为打破高通在基带处理器领域的垄断,为华为在手机领域的崛起打下了坚实的基础。

巴龙的出现也让华为建立了信心,在手机芯片领域逐渐找到自己的节奏。2014 年 6 月,华为将应用处理器和自研的基带处理器巴龙 720 集成在一个芯片上,构成片上系统(SoC,System on Chip),并率先应用在荣耀 6 手机上。这款手机芯片的名称就叫“麒麟 920”,也是我们如今最能识别华为的词汇之一。3 个月后,搭载了升级版麒麟 925 的 Mate7 也发布了,这一记二连击直接冲击了当时的手机市场,竟然对 iPhone 的销量构成了不小的威胁。就像打了一场翻身仗,华为在手机市场上一发不可收拾。华为也不断研发和更新升级麒麟芯片,搭载麒麟 960、970、980 等华为 Mate、P 和荣耀系列手机也成功在国内外市场占有一席之地。

今年年初,华为在北京举办 5G 发布会暨 2019 世界移动大会预沟通会,发布了全球首款 5G 基站核心芯片——华为天罡,强势表明自己是全球 5G 商用市场的最强者。目前,华为已经获得 30 个 5G 商用合同,25000 多个 5G 基站已发往世界各地。

对于 AI 和量子技术,虽然二者的理论研究在上个世纪就早已出现,但是直到最近几年才出现实体的应用,这都和飞速发展的半导体技术分不开。世界上各大电子巨擘也纷纷将 AI 芯片和量子计算芯片纳入自己的布局中,华为也不例外。在 2017 年,华为推出首颗手机端人工智能芯片麒麟 970,首次实现在端侧嵌入专用 NPU ,打响人工智能芯片落地智能手机领域的第一枪。隔年,麒麟 980 芯片问世,与摩尔定律“鞭策”的一样以一年一个制程的速度演进。

2018 年 10 月,华为“达芬奇”架构浮出水面,首次发布华为全栈全场景 AI 战略及计划,其中包括全球首个覆盖全场景人工智能的华为“昇腾(Ascend)”系列芯片以及基于该系列芯片的产品和云服务。最重磅的当属昇腾 310 和昇腾 910 两款 AI 芯片的发布。

至此,细数华为的芯片历史,从交换机上的小芯片做起,到消费电子芯片的整体布局,再到如今引领 5G 芯片技术,对于未来的技术华为也敢于超前。30 来年的历史,华为的芯片人孕育一个个响亮而扎实的名字,先有“ ASIC ”、后承“巴龙”、发于“麒麟”,如今的“天罡”剑指 5G 技术的中坚力量、“昇腾”要支撑全场景的 AI 计算,都印证了芯片领域没有弯道可以超车、“板凳要坐十年冷”的道理。