这家AI芯片公司,凭什么吸引了李嘉诚和阿里的大手笔投资?

AI 芯片近两年成为大热门,养出不少独角兽,但在今年下半年行业已经出现不小震荡,先是深鉴科技被美国半导体公司赛灵思(Xilinx)收购,华为在全联接大会上推出了昇腾 910、昇腾 310 两款 AI 芯片,坐实了传闻已久华为要自己做芯片的说法。而 2 个月前,阿里巴巴宣布设立平头哥半导体公司。

有人选择被收购,有人面对危机就是转机,也有新人加入战局,包括华为及阿里巴巴,后续 AI 芯片初创领域又会怎么发展?“大厂已经投入资源切入,就是行业洗牌的时候!”,耐能创始人刘峻诚在接受 DT 君采访时说。对于同属 AI 芯片创业一员的耐能,其开发的神经网路处理器(NPU,Neural Processing Unit)芯片,预计明年第二季出货,并通过与 3D 传感供应商合作,全力抢攻 3D 传感商机。

不同于几家媒体上常曝光的 AI 芯片初创公司多是从学术圈走向创业,耐能的创始团队则是来自半导体业内人士,刘峻诚曾任职于高通、三星,耐能首席科学家李湘村则是前高通多媒体研发部门总监,也曾在展讯、朗讯(Lucent Technologies)担任高管。

云端的 AI 服务可以通过 GPU、服务器、高性能计算机群(HPC)提供强大的算力,但越是终端的产品随着系统计算能力的减弱,可以运行的深度学习网络就越小,因此如何让终端设备也能执行一定程度的 AI 功能,就是耐能锁定的市场。

2016 年推出自家第一款终端装置专用的 NPU 以及软体开发套件“重组式人工智能神经网路(Reconfigurable Artificial Neural Network)”,芯片体积小、功耗低,更做到可以在终端上跑 ResNet、SSD(Single Shot MultiBox Detector)等深度学习网络框架。

在深度学习领域有几个被广泛使用的模型架构,像是 AlexNet 有 5 或 8 个网络层,ResNet 有 18 层、50 层、101 层、152 层等,而 SSD VGG-300、VGG-512 则是庞大的模型,目前主要应用在安防领域,让机器可以在空间中判断出各个物体的位置、距离等。耐能的 NPU 使用 ARM Cortex-A7、A9 处理器,却能跑得动 ResNet 和 SSD,这就是其技术独到之处。

正因如此,吸引了不少重量级投资者,去年底耐能宣布完成超过千万美元的 A 轮融资,就是由阿里创业者基金(Alibaba Entrepreneurs Fund)领投,其他投资者还包括高通、中科创达、红杉资本等。今年 5 月耐能完成由香港富商李嘉诚旗下维港投资(Horizons Ventures)领投的 1800 万美元 A1 轮融资,累计融资金额超过 3300 万美元。

尽管大股东自己当起了平头哥,要做 NPU 以及嵌入式芯片,但并不影响耐能的生意,刘峻诚透露,近期将宣布完成新一笔融资,此轮金额将超过先前累计的 3300 万美元。另外,耐能最初的商业模式是采取先卖软体、NPU IP 授权的商业模式,合作客户包括 ARM、家电巨头格力等,随着营收来源稳固,明年将开始销售自有 NPU IC。

图|耐能创始人刘峻诚(图片来源:DT 君)

进军 3D 传感,协同大厂供货结构光、双目方案

苹果 Face ID 刷脸解锁技术的问世,定义了整个科技行业的新方向,不仅 Android 阵营的手机品牌全部跟进 3D 传感,也延伸到了新零售,像是刷脸支付,或是通过扫描面部或身体的 3D 建模,可为消费者定制化产品,还有门禁解锁,就有汽车公司思考通过 3D 传感技术来取代车钥匙。

除了取代人们口袋中的东西,像是钱包、钥匙之外,还有 AR 应用,业界就盛传苹果有意在 iPad 平板电脑采用 ToF 技术,预计在 2019 或 2020 年问世。在苹果的力拱下,3D 传感技术无疑依旧是 2019 年产业的热点。

不过,目前 3D 传感技术的问题在于方案成本仍昂贵,举例来说,苹果 Face ID 的结构光模组打出 3 万多个光点到用户的脸,然后把这些讯息丢到 iPhone 的主芯片 A12 Bionic,这块主芯片里有一个神经网络引擎(Neural Engine),由这个人工智能专用加速处理器执行运算,而结构光模组成本大概是 20 多美元,主芯片大概是 70~80 美元,两者加起来就逼近 100 美元的成本,并不是所有终端产品都适合,例如物联网产品、智能家居产品等。

简单来说,3D 传感方案包括 3D 传感器以及后段的运算处理,目前较流行的做法是利用 NPU 芯片或神经网络引擎来进行后段的运算,3D 传感器取得光的信息和深度信息后,由 NPU 来运算这些数据。因此,耐能的战略是开发一个专门处理 3D 传感的 NPU 芯片,实时进行三维建模,像是人脸识别、物体或行为识别,同时解决耗能高及成本的问题,他进一步指出,一些简单的功能靠这一颗芯片就可独立运作,“该芯片价格大概在 10 美元左右”,并可搭配不同的传感器如结构光、双目或 ToF。目前已与奇景光电及台湾半导体公司钰创分别合作结构光、双目方案,进攻 3D 传感市场。

除了新零售应用,刘峻诚指出,3D 传感应用在安防领域是一大商机,将 2D 平面信息转为 3D 模型,立体化之后的好处是提高准确度,除了多加了“深度”信息之外,还能用光来感测体温,拿了照片、甚至是蜡像、雕像也无法矇混过关,除了强化系统安全性,另一个优点在于“赋予行为识别能力”,过去安防领域是通过 2D 视频来判断,可能因为角度错位导致系统容易出现误报,通过 3D 传感让机器具有行为识别能力,促使安防产品进入下一个时代。

另一个就是产线的异常检测,目前在工厂生产线上采用自动化光学检测(AOI)技术已行之有年,也就是利用高精度跟高速度的光学镜头来协助检查产品是否有缺陷,不过,近来 AOI 也兴起一股很明显往机器学习靠拢的趋势。刘峻诚认为,传统 AOI 主要是应用在“平面的”印刷电路板(PCB)、面板等行业,其他行业的曲面、立体的产品不见得适用,另外 AOI 准确度仍有很大的改进空间,更多时候是需要靠人力来检查,通过 3D AI 技术即时 3D 建模,可以更精确检查产品的焊锡是否准确等,同时成本得以下降。

从卖 IP 到卖 IC,瞄准物联网及新应用

从初期卖 NPU IP 到准备开始卖自有 IC,特别是耐能的投资方还有一个芯片巨头高通,难道不怕得罪投资方?“在手机跟安防领域,我们是不可能自己做芯片去跟巨头竞争,”刘峻诚说得很坦白。

他进一步分析,目前手机市场就只有前五大业者才有出货量,但手机芯片行业已被高通及联发科拿下,而在安防领域,行业巨头海康威视、大华也自己跳下来做晶片,“今天做个晶片跟巨头 PK,那我就是找死!而且 NPU 其实只是一个协处理器,耐能做的是帮助客人强化他们的产品线,”因此耐能在手机及安防领域的策略就是销售 NPU IP,一是让客户的芯片在 3D AI 功能更强大,二是让新切入芯片领域的巨头能够加速 IP 整合、开发芯片。

在手机跟安防领域不直接与巨头竞争,耐能瞄准的是物联网以及新兴应用,“有些领域并没有这种独占性,物联网至今就没有所谓的赢家,但是有很多生态链,像腾讯、阿里巴巴、小米等,”刘峻诚指出,这些就是耐能将直接销售 NPU 芯片的领域。

芯片是老师傅当道,AI 芯片初创公司的前景如何?

对于今年 AI 芯片初创公司陆续有一些变化,未来整个市场发展又会如何?他认为,“大厂已经投入资源进来,华为就是一个代表”,华为的两款升腾芯片 910 和 310,各自对准云跟端,“当大厂切进来打的时候,这个行业洗牌的时候就到了”,“半导体芯片门槛还是高的,是老师傅当道”,例如,高通是不会让一个 7 年以下工作经验的人到第一线做产品,“直接做大型晶片,跟大厂竞争是傻的”。

其实可以检视一下 AI 芯片独角兽们的产品策略,有两家企图攻进云端市场,像是数据中心,但云端市场早已是巨头把持的天下,谷歌自研的 TPU 已经开始对外提供服务,除了半导体巨头 NVIDIA 之外,更不用说还有一个在数据中心具有极高市占率的英特尔,不只芯片,内存以及传输介面(Interface)都是它的强项,因此英特尔的优势在于“整体系统”的性能强大。

另外,汽车领域也吸引了不少芯片初创企业投入,国内就有一家知名的独角兽推出了自动驾驶芯片,“但车的整个开发周期是三年到五年,时间很长,小公司没有营收,发展会比较辛苦”,更重要的是,在这个领域会遇到 NVIDIA。众所皆知,NVIDIA 跟国际车厂包括奔驰、奥迪等,已经建立深厚的关系,而且汽车并不在意功耗问题,只重视系统的稳定度及可靠度,因此想要跟 NVIDIA 抢食自动驾驶芯片的蛋糕,难度其实很高。

因此,耐能的策略很清楚,“我们不碰“云”跟“汽车”行业,专攻“端”,”刘峻诚强调,把过去依赖大量云端算力进行的 AI 计算,搬到终端上来实现,也就是边缘运算,但尽管是锁定“端”的 AI 市场,在安防跟手机领域是以卖 IP 为主,不会去跟大厂竞争,而是帮助他们技术提升,抓住自己的独有性。

内存跟 I/O 将是下一个重要趋势

面对这场 AI 芯片大混战,刘峻诚倒是看得很冷静,“估值喊得再高,本质还是要创造价值”,就是“比谁的气比较长”,“能做的就是赶快找一些细分领域做突破、做前沿技术开发”,他进一步分析两大趋势,AI 发展后,未来一定是多个 NPU 多核堆叠起来,因此内存跟中间的 I/O 传输会是下一个非常重要的领域,像是内存内计算(In Memory Computing)以及高速传输介面 SerDes。

由于 AI 或认知运算都需要处理非常大量的资料,如何有效率处理这些数据就成了关键,现今的电脑架构都是使用冯诺伊曼架构(von Neumann architecture)来运行,但基于冯诺伊曼架构,在执行 AI 应用时,处理器和记忆体之间需要大量传输资料,耗费资源且效能不佳。

许多重量级研究机构都已经投入相关研究,除了美国美国国防高级研究计划局(DARPA)资助开发一种全新的非冯诺伊曼(non-von-Neumann)架构处理器之外,今年 4 月 IBM 研究团队发表了一个全新的混合式精确内存内运算架构(Mixed-precision in-memory computing),将计算型内存单元(Computational memory unit)加入冯纽曼架构(von Neumann architecture),来提高 AI 训练的效能。

随着 AI 芯片的行业正走向洗牌,初创公司必须开始做出差异化,因此耐能已经投入上述两大领域的开发,希望在未来的前沿领域仍可跟巨头竞争。