在近期创业邦颁布的“2017中国企业服务创新成长TOP50”和猎云网颁布的“2017最具投资价值创业公司TOP20”中,我们看到了同一家公司的身影——Video++,而在今年上半年,Video++还曾拿下2017 ECI Awards技术创新大奖、TopDigital等多个奖项。
Video++作为一家人工智能公司,定位于消费级视频领域的视频互娱广告和视频电商的应用。那么,Video++是如何将AI技术应用到了消费级视频领域,Video++的AI技术又做了哪些技术上的创新?
Video++专注于消费级视频的广告/电商应用的系统技术开发者,在Video AI方面主要完成了人工智能技术针对消费级视频的自动化广告投放和自动化电商转化的商用产品架构和高价值目标识别的算法开发。在商用架构方面的主要创新在于:算法部署插件化管理、AI算法调度及与前端应用解耦、视频分析与video os视频互动平台的深度结合、样本管理系统和运营反馈机制。
Video++的AI算法包括消费级视频中人脸、物体、场景等多个维度的识别和跟踪定位,下面会从以上几个方面分别来阐述:
人脸识别算法能够满足消费级视频的有效及高效的处理。消费级视频本身的特点包括镜头的多变性、视频质量参差不齐、干扰因素众多等。算法围绕着解决此类问题进行设计和优化。主要创新点包括:镜头分割作为预处理模块、跟踪模块、人脸图像质量评估模块、轨迹标签融合模块。
Video++的物体识别算法同样针对大众消费级视频进行了设计,相比较传统图片级别识别,消费级视频里物体检测具有背景复杂,场景多变,物体遮挡严重等问题。目前已经训练模型,衣食住行共38大类,常见物体20类,另外针对广告价值较大的轿车以及手机重点训练。产品包括汽车、手机和其它常见物体识别。
Video++的场景识别采用自收集的消费级视频库作为训练数据,训练深度神经网络模型,提取相关特征,并在特征空间上训练场景分类器。为了收集对训练模型更有帮助的样本,采用了负样本的在线收集和模型的自动迭代机制,模型训练好之后并不是一劳永逸,二是根据当前模型存在的缺陷,即识别错误的样本,进行不断地改进。方法是通过收集线上识别错误的样本,反馈到训练集中,定期用更新的样本集重新训练分类模型。由于新加入的负样本是之前模型识别错的样本,其对分类器的改进能产生比普通样本更大的贡献,能以较少量的样本实现分类器性能的提升。
视频内物体跟踪技术是已知物体在视频中的初始位置,在接下来的时间里,自动获得物体运动轨迹的一种技术,涉及到图像处理、模式识别、人工智能等前沿技术。Video++的物体跟踪技术提供实时(30帧/秒)、高准确率的视频内物体跟踪功能,可有效跟踪不小于8*8像素的物体,能够应对复杂场景以及光照变化,并支持自适应物体形变、尺度缩放、部分遮挡、跟踪丢失检测、多目标实时跟踪等,显著提高了视频端的交互体验。
在完成了消费级视频中人脸、物体、场景等多个维度的识别和跟踪定位之后,Video++再对从消费级视频里收集到的数据进行商业化应用,通过其建立的一整套的视频互娱广告系统和视频电商系统来实现和呈现。视频平台/直播平台可以在AI识别和跟踪的基础上找出适合的广告点和植入时间,提升用户的广告好感度及转化率,为广告创造增量,也可以向用户推送相关的商品信息,反正只要接入了这两个系统,就可以一站式全部解决视频原生广告和视频电商的需求。
““比如一个酒吧或者聚会的视频场景,里面就可以自动插入百威这样的啤酒广告,还可以提供包括卡牌收集、在线投票、红包、抽奖等互动游戏,以增强用户参与感和互动感。同时也可以在视频里直接购买百威啤酒,直接带来交易额。”
Video++表示,他们能够运用AI识别技术为视频做增值互动,核心在于工程化和产品化,而这主要在于他们对视频场景的深刻理解和把握,未来他们也将继续挖掘场景,为视频场景创造出更多更好的功能体验。