一如 NVIDIA 从 2017 年之后持续弹奏的主旋律,这场在苏州举办的 GTC 大会也是以“ I Am AI” 开场,NVIDIA CEO 黄仁勋也出席了 NVIDIA 今年最后一场的 GTC 大会,一如过往,被 NVIDIA 粉丝暱称为 “黄教主”的黄仁勋,丝毫看不出受到近来 NVIDIA 财报不佳、股价连续重挫的影响,照样神采奕奕的在今年 GTC 大会上以昂扬的声调语气卖力传教。
NVIDIA 最近股价的跌法,和 2 年前从 70 美元附近起涨之后的涨法一样,都让许多人来不及反应,当初是涨得让人措手不及,而这次,则是跌的让人进退不得。 2018 年的高点 292 美元,到经过几天重挫之后终于略见止稳的 20 日收盘价149.8美元,NVIDIA 股价接近腰斩的走势,有人认为是有部份原因来自于整体美国科技股大跌的拖累,但不可否认的是,站上 AI 产业浪头最高点的 NVIDIA,是过去 2 年全球AI热潮中最大的获益者之一,不论从股价涨幅、或是获利增长,甚至是黄仁勋在整个产业的地位来看,都是如此。
NVIDIA 近来的处境,固然有其他因素的影响,但不可否认,在 AI 领域,NVIDIA 仍有非常高的不可取代性。许多人或许会认为,这场在苏州金鸡湖畔的 GTC 大会没有新产品的亮点,但根据 DT 君的观察,包括 HGX-2 在中国的落地,就有百度、腾讯、浪潮、联想等大厂的加入,又或者是刚发布的 NGC 容器(Container),更可看到阿里云、联想、浪潮、华为以及曙光的身影,以此来看,NVIDIA 的近来或许确实略见憔悴,但既有的根基不失,NVIDIA 的实力仍是其他后进架构业者短期内难以撼动的。
根据 DT 君观察预测未来几季的产业市场变化,NVIDIA 的冬天可能还会持续一段时间,也许几季、也许一年,但不论如何,在今年最后一场的 GTC 大会上,宣布与多家中国大厂持续在新项目上的持续深度合作,能与中国大厂客户一起抱团过冬,或许是 NVIDIA 在这场 GTC 大会上最值得被注意的的关键亮点。
对 NVIDIA 而言,虽然主要新产品还是会在 GTC 大会上揭露,但随著 GTC 举办的次数增加,由于不可能每一次大会的举办都刚好会有配合新产品发布,因此 GTC 已经从过去的新品发表定位,转而成为生态布局的宣示大会,而这次在苏州举办的 GTC 大会上,也同样不见新产品的曝光。
图 | 黄仁勋(来源:DT君)
然而,NVIDIA 执行长黄仁勋在这场大会上也不改其一贯本色,除了展示其游戏性能优势以外,在专业计算领域则是强调合作厂商的生态布建,强调其 GPU 不仅性能具优势,也同时是最广泛,也最好用的 AI 加速设备。
图|通过机器学习,图灵架构可以提供更好的游戏画质表现(来源:DT君)
图|光线追踪技术仍是 NVIDIA 独享,效果也相当优秀,只是应用支持还有待成熟(来源:DT君)
除了一开始由网易的逆水寒游戏和实时绘图 demo 展示其光线追踪效果作为开场,这场大会上,主轴还是围绕在计算能力方面。
图|NVIDIA 以各种形式突破摩尔定律限制,让 GPU 成为未来计算核心(来源:DT君)
图|GPU 已经是全球 Top 500 超算榜单上的常胜军,不仅是绝对性能指标,在能耗表现上也是名列前茅(来源:DT君)
图|AI 是未来包含超级计算机以及超大规模服务器计算丛集的未来趋势(来源:DT君)
HGX-2以其性能优势获得中国服务器厂商青睐
首先,在今年稍早发布的 HGX-2,号称是规模最大的单一 GPU 计算架构,搭载 16 块 Tesla V100,以及 512GB 内存,可为企业提供能强大的运算能力,该公司表示,将其用于 ResNet-50 训练基准测试上,每秒能训练 15 万 5 千张图片,其算力相当于一台拥有 300 颗 CPU 的服务器。
图 | 前些时候发表的 AI 计算方案已经获得大规模采用
另外,HGX-2 亦提供多重精度(Multi-precision)计算,能为其客户带来更广泛的应用弹性与应用场景,比如说在科学计算和模拟这类要求高数据计算精准度的应用上,HGX-2 能提供双精度与单精度浮点数运算,另外,也可以使用半精度浮点数或是 Int8 来做人工智能模型的训练以及推测计算。
相较起新兴的 AI 计算方案,多半集中在推理或者是低精度的机器学习能力上,并以最宽松的标准来定义其包含 TOPS 或 TFLOPS 等算力指标,NVIDIA 为了要和客户达成更紧密的合作,还是选择比较不夸大的性能指标定义。虽然乍看之下 NVIDIA 可能在算力指标落后于其他 AI 后起之秀,但就实际应用上仍能占有优势。
图|中国一线云计算与服务器供应商都已经加入 HGX-2 的生产与使用行列(来源:DT君)
而在本次 GTC 上的重磅消息之一,就是 HGX-2 在中国的落地,其客户包括了百度、腾讯、浪潮、联想等。而值得注意的是,积极发展自有云计算硬件的曙光和华为也是 NVIDIA 此波宣布的客户之一,可见其强大的软件与硬件互相搭配的生态实力仍非不具备成熟生态的后进架构所能相提并论。
图|主要云计算服务商都采用了 NVIDIA 的新架构,导入的速度比以往快了许多(来源:DT君)
图|T4 在小布局上可达到标准 GPU 计算性能,且功耗更低,目前已经被作为百度云主要的推理计算核心(来源:DT君)
通过NGC容器大幅加速机器学习落地
而另外一个重点在于甫于上周于 SC18 发表的新版 NGC 容器,也成功开拓主要云计算中国客户。NGC 容器登录服务现在已经可提供 41 项用于深度学习、HPC 和 HPC 可视化的框架和应用程序(去年为 18 个)。而近期增加的内容包括 CHROMA、Matlab、MILC、ParaView、RAPIDS 及 VMD。
在 GTC China 大会中,黄仁勋展示通过 NGC 容器的支持的效果,可为研究人员提供一个快速开发的平台,提供快速构建、训练及开发深度学习项目所需的性能和灵活性。NGC 容器登录服务最早便推出五个支持多节点部署的容器,让这件事变得简单,使得在多个节点(各节点又有着多个 GPU)上运行大量计算工具,是一件极为轻松的事。而在最新的更新版中,可在 Singularity 容器里使用 NGC 容器,更有助于客户简化部署工作。Singularity 是一种超级计算机设施广泛采用的容器技术。
图|NVIDIA 的开源机器学习加速库以及是许多云服务厂商的框架(来源:DT君)
过去阿里云服务已经是 NGC 容器的爱用者,而亚马逊网络服务 EC2,谷歌云平台,微软 Azure,甲骨文云基础设施基本上也都支持了 NGC 容器,而 NVIDIA 在苏州 GTC 上发布的最新 NGC 容器 Ready 计划合作伙伴,包括了联想、浪潮、华为以及曙光,通过这个技术,采用来自这些厂商的服务器,可大幅缩短部署 GPU 加速应用的时间,并强化最终应用效能表现。
图|黄仁勋再次强调 RAPIDS 对于加速机器学习的帮助(来源:DT君)
RAPIDS结合庞大开源GPU数据,帮助全球主要云服务厂商快速部署基于GPU的AI算力
而在上个月,NVIDIA 在北京所发布的 RAPIDS 开源 GPU 数据加速平台也获得重要客户的采用,包括华大基因用以进行癌症治疗的研究,而中国移动则是利用该加速平台来进行网络优化工作,至于平安科技则是使用该技术来发展大型疫情监控与预测平台,都是用来解决与我们最切身相关的问题。
RAPIDS 的概念是,典型的大数据分析流程大致分为数据准备、数据合并、数据降维三个步骤,很多数据特征需要靠行业或专业领域的专家去理解,并事先把它们提取出来。因此在 Machine Learning 中需要训练过程,这是一个不断的循环过程,在不断优化、不断调整参数的过程中,提高训练过程的精度,从而得到更准确的预测结果。
图|RAPIDS的成功案例(来源:DT君)
为了达成这样的大数据分析流程,就必须整合多种开源工具的力量,从不同类型的数据下手,最终形成更具效率的机器学习与训练过程。
RAPIDS 构建于 Apache Arrow、pandas 和 scikit-learn 等流行的开源项目之上,让 GPU 可以在最流行的 Python 数据科学工具链带来提速效果。而为了将更多的机器学习库和功能引入 RAPIDS,NVIDIA 也广泛地与开源生态系统贡献者展开合作,其中包括 Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 负责人兼 Apache Arrow 缔造者 Wes McKinney 以及迅速增长的 Python 数据科学库 pandas 等。
强调软件与生态,本次GTC重点在于GPU的技术落地优势,而非空谈云端
NVIDIA 通过本身计算架构的改进,开发工具的完备,并结合主流开源工具,尽量让更多的应用情境可以用最快的速度套用在 GPU 加速设计中,这种投资没有捷径,而一旦完成,就可大幅确保其在计算领域中的优势可继续维持,而不用惧怕被后来者迎头赶上。
通过这场在苏州举办的 GTC China 大会,NVIDIA 似乎也是在向中国的许多 AI 架构发展厂商传达 1 个信息,那就是 NVIDIA 并不是只在硬件架构上耍把戏的厂商,要做好 AI 计算、云计算,没有软件、周边配合,就只能注定在狭窄的应用场景中求生,那么,就算设计出来的硬件架构如何高强,最终也将如无米可炊的巧妇。
而值得注意的是,根据 NVIDIA 透露出的最新信息,全球范围已经有超过百万开发者注册 NVIDIA 的开发社群,同时 NVIDIA 也在全球高等学府提供多种基于 GPU 计算的课程教育,从根基打起,并扩及产业。
另外,NVIDIA 的 GPU 产品也是目前除了 CPU 以外最普及的计算架构之一,目前稍微高端一点的电脑里面可能都会有 GPU 存在,但一般人要拿到寒武纪的计算卡来作个人开发用途是几乎不可能的事情,而这点也决定了 GPU 在计算产业的影响力。这也是 NVIDIA 之所以坚持 GPU 之所以为 GPU,而不愿意打造如常见后进 AI 计算芯片那种纯粹化的计算架构的最大理由。