人工智能创业:“多解决些问题,少谈些主义”

无需赘言,在中国,几乎被视为“新经济”同义词的数字经济,对宏观经济的拉动作用已非常明显:2017年中国数字经济规模达到了27.2万亿元人民币,同比增长20.3%,对GDP的贡献高达32.9%,最乐观的预计是,到2025年这一特殊拐点,数字经济有望成为中国经济发展的第一引擎。

在此背景下,每年贵阳数博会的如期而至,科技巨头与创业者齐聚中国西南一隅,更像是一次对数字经济过往成绩的全面复盘,以及对可预见未来的一次全面预测——尤其搁置在最近一系列推进信息化与工业化充分整合的政策部署下,今年数博会“数化万物,智在融合”的主题,也充分勾勒出构建“数字中国”的历史机遇。

就在不久前,国务院发展研究中心发布了《传统产业数字化转型的模式和路径》,为“数字化转型”下了一个精准定义:“利用新一代信息技术,构建数据的采集、传输、存储、处理和反馈的闭环,打通不同层级与不同行业间的数据壁垒,提高行业整体的运行效率,构建全新的数字经济体系。”

这条路并非坦途,如何进一步充分释放数字对经济发展的放大、叠加和倍增作用,需要政府和企业的合力锻造:从国家层面,必不可少的当然是更睿智的顶层设计,更丰富的数字化基础设施建设;从企业层面,如何拿起最新的技术工具,完成对传统领域全产业链条的重塑,或许将成为数字化转型的胜负手。

令人欣喜的是,谈及最新技术工具的“装备库”,现阶段中国的确握有一手好牌——在大数据和人工智能等数字经济的基础设施领域,无论从技术还是数据角度,起跑线的相对公平,都将赐予中国一次难得的“领跑权”,就拿人工智能来说,尽管短时间内诸如DeepMind等对人类影响深远的开疆拓土型公司不会在中国诞生,但若论及产业落地的速度,在大概率上,中国或许将成为先行者。

更像是对上述观点的某种印证,不难发现,尽管今年贵阳数博会在国际化和市场化程度上明显提高,但若论及纯粹的“黑科技属性”,相比于去年街头卖艺式的吸睛程度(可能有些过分喧嚣了),今年参展企业似乎变得“务实”许多。最典型代表就是去年凭借唇语识别获得数博会十大黑科技称号的海云数据,刚刚在2018数博会人工智能全球大赛-北京站夺得总冠军的他们,尽管风头依旧,却并未捧出在大众层面多么惹眼的新技术,而是展出了一整套行业业务解决方案。

事实上,分析不少科技企业从“务虚”走向“务实”,得从这一轮科技革命的两种落地方式谈起。

技术变革的两种路径

其实从最底层的逻辑上,正在发生的这场技术变革,一直有两条相互交叉的技术路径,二者彼此渗透,共同完成了对传统行业的改造。

就拿AI领域来说,众所周知,人工智能产业链分三层:最底层包括芯片和开源框架等基础设施,这一层门槛最高,以前段时间颇为敏感的CPU和GPU为例,中国企业想赶上英伟达和高通等巨头,摊开最激进的时间表,也需要5-10年,这一层更多依靠的是时间的陈酿,现阶段还是巨头间的内斗,先暂且不表。

中芯还在28纳米苦苦挣扎时,台积电7纳米的芯片已于2017年4月开始试产

最受大众关注的变革发生在中间层。这里群英荟萃,无论巨头还是新贵,都致力于完善图像识别,机器翻译,语义识别和语音识别等通用技术——事实上,走第一种技术路径的,也大多集中在这一层:他们亲尽全力,完成上游通用技术的攻坚。选择这一技术路线,无疑需要背后庞大的体量支撑(譬如谷歌),或者超高专注度,譬如据媒体报道,商汤科技就拥有百人级别的博士团。

而对算法的深耕,也会下沉至具体行业,迅雷创始人程浩老师就举过两个例子:高级驾驶辅助系统解决方案的Mobileye 成立于1999 年,直到8年后才挣到第一桶金;达芬奇手术机器人从启动研发拿到FDA认证,花了十年时间——这并不难理解,无论自动驾驶还是机器人手术,理应需要算法上的无限精进。

算法的精进固然令人欣喜,但另一方面,更理性的观察者,也不该被所谓“技术的纯粹性”蛊惑,事实上,在大多数对“识别率小数点后几位”没那么敏感的行业(比如门禁时的人脸识别),算法之间的细微差别对最终结果影响不大——尤其在安防和航空等需要行业积淀的领域,算法壁垒没有自动驾驶那么大,这些行业的AI玩家,最锐利的武器应该是“行业纵深度”和工程化能力,懂“需求”远比懂“技术”更重要。

这就引出了另一条技术路径:他们选择将技术“沉下去”,选择有限的垂直领域,然后亲尽全力,深入到这些行业的五脏六腑,通过为一个个行业客户服务和赋能,逐渐拼凑出一张详实的知识图谱,然后再通过知识图谱反哺新技术与行业应用——值得一提的是,深谙这种技术路径的公司,许多时候也会选择AI中间层的通用技术,但由于率先捕捉到这个行业的痛点,他们得以从业务逻辑维度,完成更具效率的创新,最终在新技术与知识图谱的双向加持下,一举解决行业痛点。

更“务实”的AI

说来稍显凌乱,甚至一头雾水,不妨以海云数据为例,剖析后一种技术路径的落地。

这家公司以大数据可视分析起家,近年来试图完成某种蜕变,通过AI与可视分析的融合,以及在安防等领域多年沉淀的行业知识,推出了一系列与行业结合紧密的解决方案。他们将自己最主要的业务逻辑命名为“能力服务”:通过推动上游新技术支持与政务应用深度融合,为决策层提供调度指挥顶层设计。

这种能力服务现阶段的标志物,就是在数博会上颇为风光的图易AI能力服务平台。在这一平台上,通过整合软件、硬件、数据和算法,客户可根据不同需求,用“傻瓜式”操作(全程“无代码化”)组建自己的AI能力模块,今后也可根据不断增加的业务需求,更新自己的能力矩阵,像搭积木一样,完成业务的效率提升和数据决策价值变现。

图易6

以海云数据深耕多年的安防领域为例,基于图易研发的“智警大脑”,已经让不少决策机构的公共安全能力得以飞速进化。“智警大脑”已在40个细分领域内形成了200余个行业能力,且融合了语音识别和人脸识别等人工智能技术(如前所述,这些都是AI中间层的通用技术)——举个例子,它可以通过人脸识别进入后台,然后通过语音指令调出事故现场视频,附近的警力、周边卡口、情报分析情况、犯罪嫌疑人的路径、重点嫌疑人的档案等节点,可以瞬间通过一张图和一张网的形式,让公安人员实时看见,确保在事故发生后公安部门能快速处理。目前“智警大脑”已经服务了全国超过三分之一的公安市场,使公安情报分析准确率提升70%,指挥决策效率提升50%。

智警大脑

受益于图易AI能力服务平台的,还有另一个与数据决策紧密相关的领域:航空。

举个最近的案例,作为目前国内机场规模最大的指挥大厅,白云机场运行控制大厅部署的决策指挥平台——“白云机场可视化智能指挥决策系统”,即是由海云数据与其战略合作伙伴广东机场白云信息科技有限公司共同打造,双方联合研发了名为“启明星”的航空大数据解决方案,后者可以将机场“三大区”(飞行区,航站区,综合区)的各项业务数据充分整合,集合空管、气象、交通、地图、运营商等数据,结合大数据可视分析技术与AI技术,实现对“五大流”(飞机流,旅客流,行李流,货物流,交通流)全区域覆盖和全流程管控,通过分析机场当前的综合运行态势和各场区运行动态,对机场整体态势进行实时可视化展现,帮助决策者通过“一张屏”了解机场整体运行状况。

从上述案例中不难发现,海云数据希望给客户提供的,是一套封装完备,体验良好,“即插即用”的综合解决方案,他们一直致力于推进“上游新技术支持”与“下游行业应用”的衔接——最为值得一提的是,一旦他们发现,市场上现有的AI通用技术无法满足为客户赋能的需求,或者无法百分百解决行业痛点,作为综合解决方案提供者,他们也会“亲自上阵”,完成从0到1的技术攻坚。

弄懂这个逻辑,你也就理解为什么他们去年看似“无心插柳”地发布了唇语识别成果(还顺带拿了去年数博会“十大黑科技”称号),其研发初心非常简单:解决公安大量无声视频中数据缺失的难题。

众所周知,公安系统中视频信息量颇为庞大,但大多以默片方式存在,只看得清嘴型,却不知说些什么。针对这一行业痛点,海云数据研发的唇语识别能在最大程度上释放视频图像里的信息——更重要的是,它能与大数据可视分析系统充分嫁接,让决策者能从声音,图象,视频,空间和地理信息等多重纬度,进行综合态势的判断,大幅度丰富现有的公共安全大数据一站式综合解决方案。

唇语识别技术

令人欣喜的是,类似这种“保姆级”的能力服务,海云数据的图易平台已在公安、司法、监察、交通、消防、军工、智慧城市等领域均形成深度的行业应用。

所谓AI“务实”,莫过于此。

结语

当然,在我个人看来,上述两种技术路径,其实是两种不同分工,谈不上孰优孰劣,只有它们彼此渗透,共同进化,才是AI疆界最完整的图景——只不过,对于更“务实”的行业客户来说,如何利用新技术与下游应用结合,提升业务效率,真正产生效益,才是他们此刻最迫切的需求。

嗯,这么说好像稍显“功利”,但所谓建设“数字中国”的恢弘愿景,不也正是不同行业里那些真正的务实者,基于一个个具体的问题,一点一滴拼凑起来的么?

“多研究些问题,少谈些主义”,胡适这句箴言,放在AI领域,好像也同样适用。