019年是公认的人工智能落地之年。2019开年一个月内,陆续有三家语音领域的AI公司——云知声、思必驰及猎户星空(猎豹旗下AI公司)杀入AI芯片市场,推动了AI芯片领域的战火升级;2月27日,地平线宣布完成6亿美元B轮融资,此轮融资规模,打破了AI芯片创业公司融资纪录。
按照钛媒体在 2018 年的观察,业内各类 AI 芯片发布会上,人工智能技术专业名词不再是重点,最受关注的指标成为:进入了哪些场景?合作了哪些客户?有没有软硬一体化方案?
商业历史来看,芯片和半导体行业本身就足够艰难;2019年的AI芯片落地年,竞争中的公司们正在争相给出答案。
如同特工电影中的情节,张凡和他的伙伴一般会在午夜行动。
这是一个四人组合,包括技术工程师的张凡,还有两名工人和一位项目经理。行动地点位于上海南京西路上的一家零售门店。
潜入店面后,张凡掏出笔记本,开始主攻店内摄像头的IP地址配置,工人则参照规划好的设计图纸开始布线,项目经理负责统一调度……不过,与特工电影中主人公对监控探头躲闪不及的情况不同,张凡团队此行目的,正是为了店内的摄像头。
张凡是国内 AI 芯片厂商地平线的技术支持工程师,昼伏夜出是他日常的工作状态。他当晚的工作,就是在100平米的店面内,安装10个地平线高清人脸识别网络摄像机。
人脸识别摄像机比一般的监控探头安装要求更加精细,安装之前的环境测试就必不可少。张凡向钛媒体展示了两样基本工具,黄色的照度计(又称乐普司仪),用以测试室内/门口/门外不同位置的光线强度,以调整合适的摄像机曝光参数;红色的激光测距仪用来在商业环境中采样,在各个高度轮番测试以获取最好的抓拍角度。
在加入地平线之前,张凡曾在新加坡、日本的零售集团工作十余年。在他看来,从传统摄像机到人脸识别摄像机的变化,背后反映的是零售客流分析方式的升级。
“以前是单纯的人流计数,把摄像机垂直向下照射安装,从经过的人头数统计客流;现在用人脸识别,可以知道消费者是谁,什么时候来的,逛了哪些店。”张凡对钛媒体说。
从“识别”到“分析”,曾经在商业空间密布的摄像头被赋予了多一层意义。在消费者看不到的地方,一枚小小的AI 芯片深藏在地平线人脸识别网络摄像机中。这款名为“旭日”的芯片,是地平线在2017年底发布的,它的功能,是在摄像头中实现人脸的获取、识别与分析,以完成实时的性别、年龄等属性计算。
除了零售以外,硬件终端是 AI 芯片应用的另一重要场景。
去年4月,原三星半导体(中国)研究所担任所长周军宣布加入国内 AI 公司 Rokid。2个月后,这家以智能音箱宣布推出AI语音专用芯片:Rokid KAMINO18,在其官方演示视频中,一位 5 岁的小女孩把Rokid KAMINO18与扬声器、电路元件简单组装后,即可制作出一个带有智能语音交互功能的AI 音箱。
从任职十三年的巨头三星来到 AI 新秀公司 Rokid,周军正重新成为“创业者”。在三星时,周军有一间会议室般大小的独立办公室,来到 Rokid 后,他挤在技术部门的一个格子间中,以便“马上了解工程师们的想法”。
“在三星,诸如芯片设计之类的关键技术会花1-2年去立项规划,每个工程师分工也很细,追求的是’稳’;而 Rokid 更讲究快节奏,工程师要从驱动、算法做到应用,每个模块都需要掌握,这就逼的大家对没尝试过的事情向前冲。”周军对钛媒体说。
激烈的竞争环境是迫使周军团队快速迭代的重要原因。
2018年称得上是国内 AI 芯片元年,不仅阿里巴巴、百度、华为等巨头在这一领域持续加码,也涌现出寒武纪、地平线等新兴独角兽,单是AI 语音芯片这一垂直赛道,就在一年之间涌入包括云知声、出门问问、思必驰、Rokid 等诸多厂商。
不论是巨头还是初创企业,能否落地,是衡量 AI 芯片公司发展态势的重要因素。
这种落地首先体现在量产。Rokid北京AI实验室负责人高鹏在采访中说,“衡量一块芯片成功与否的标准,就是看它能否大规模的应用于产品。” 云知声创始人黄伟也曾表示:“我们的芯片是有客户的,不是PPT造芯,更不是自嗨。”
更关键的落地动作体现在AI 芯片公司选择进入的场景。目前市面上 AI 芯片主要分为云端 AI 芯片与终端AI 芯片,两者区别在于,云端AI 芯片部署在大型服务器中,可支持图像、语音等不同类别的AI 应用;终端芯片则被放在音箱、摄像头等硬件设备中,体积小、功耗小,但一般只支持1-2种AI 应用。
由于云端芯片起步较早,且需要关联的CPU/GPU等硬件成本投入规模高,该领域已被英伟达、Intel等巨头瓜分殆尽;而终端芯片尚未形成寡头格局,再加上国内自动驾驶、安防、零售、智能硬件等行业互联网化后诞生的丰富数据,与线下场景结合更紧密的终端 AI 芯片,目前已成为国内从业者一致看好的领域。
AI 芯片领域正掀起一轮场景争夺战。
按照钛媒体在 2018 年的观察,业内各类 AI 芯片发布会上,晦涩的人工智能技术名词不再是唯一重点,更受关注的指标变成了:进入了哪些场景?合作了哪些客户?有没有软硬一体化方案?是否已经有标杆案例?……
不过,AI 芯片风口虽然看似新鲜,内里却依然包裹着传统半导体生意的内核,在这两种区别万千却又藕断丝连的模式里,一方面是新兴 AI 市场对终端升级的旺盛需求,另一方面,则是新生事物在诞生时遭遇的重重阻碍,可以预见,矛盾将继续存在于AI 芯片2019年的发展路线中。
需求端革命
地平线 CMO 陆晓明重复用一个词来描述时下零售业遭遇的困境:内外交困。
在加入地平线以前,陆晓明曾在欧莱雅集团任职长达15年,是欧莱雅(中国)第一代中国籍副总裁。在他看来,传统零售不仅面临内部员工、房租、供货价等成本的上涨,更是遭遇着外部电商兴起、网红经济的冲击。如今,零售行业亟待出现一种新的营销模式,把曾经被分流的客群“拉”回来。
地平线的人脸识别摄像机为此提供了新尝试。在其摄像机捕捉到人脸后,后端的“旭日” 芯片就可以为人脸赋予一个Face ID——这是一份由眼距、鼻翼点、嘴到笔尖等人脸特征组成的数据档案,凭借这份Face ID,曾经来去无痕的消费者有了更清晰的数据面目,广告商也不再对线下流量的经营变得无从下手。
陆晓明以地平线与百丽的合作举例:商户将摄像头获取的人脸信息与后台消费者数据打通后,当消费者走进店内,店员手持的iPad 设备即可显示进店的是生客还是老客,以及对应的性别、年龄、过往消费记录等信息,店员即可进行更有针对性的商品推荐。
另外,智能摄像机可以捕捉消费者在零售空间里的“逛、看、试、买”等行动轨迹被,并对此进行分析处理,在保护客户隐私的前提下,这些数据成为品牌度量自家门店陈列、产品丰富度、动线设计的重要参考。
以地平线曾经合作的一家运动品牌来说,原来该厂商的配货习惯是按照男女式商品7:3的比例,而在投入人脸识别摄像机观察数月后,厂商发现前来消费的顾客中,男女比例近乎持平。因此,厂商开始在配货比例中拉高女款商品份额,在调整后的第一个月,门店整体业绩就提升了近20%。
“零售商调整产品格局有助于增加消费者的新鲜感,一般大型商超品牌每三个月就会调整一次,生活超市1-2周就会调整。在过去,门店调整商品的依据多是按照感性的经验,现在就有了理性的数据。”陆晓明对钛媒体说。
如果说零售业的自身困境,从侧面刺激了 AI 视觉芯片的市场增长,那么硬件端对 AI 芯片的热情,则是源于对低门槛取得语音交互能力的旺盛需求。
2010年成立的图灵机器人就是这些AI 语音芯片的典型买家。
“每个规格的芯片都有自己的特性,有些芯片非常便宜,性能就会差,无法支持诸如打断唤醒这种前端能力,这类芯片就适合高性价比产品;像 Rokid KAMINO18这样的AI 芯片,支持4麦阵列,就很适合智能音箱场景。”图灵机器人儿童事业部总监刘峰对钛媒体表示。
作为 AI 语音交互技术提供商,图灵机器人在儿童场景深耕多年,向儿童智能设备输出全链路语音对话服务和硬件方案是其核心业务之一,目前已与火火兔、小米、360等超过100家厂商合作推出了多款智能产品。
由于旗下合作产品线众多,刘峰对钛媒体表示,在向客户输出软硬一体件方案时,图灵每个月的芯片采购量达数十万片。
作为AI芯片的买方,刘峰表示,采购芯片是一个“对症下药”的过程。
“我们最关心的首先是芯片的规格,其次就是价格。也就是在实现同样效果和体验的前提下,芯片能否在物理上将成本上压得更低。” 在他的采购列表中,既包括了诸如 Rokid KAMINO18 这样的 AI 语音芯片,也有全志、联发科、乐鑫、炬力这样的主流芯片厂商。
在终端厂商看来,AI 语音芯片相当于把这些公司最成熟的算法与硬件标准化,让智能硬件得以直接获得这部分技术成果,降低了获取AI 语音交互能力的门槛;但相比发展时间更长的通用芯片,AI 芯片也有着支持场景单一、功能模块单薄、利润空间有限等缺点。
“市场对AI芯片还是持拥抱态度,这源于国内有着丰富的应用场景与终端,但劣势在于,国内的半导体发展时间较短,很多AI芯片公司是被需求和场景推着往前走,这就会埋下隐患。”信熹资本主管合伙人兰有金对钛媒体表示。
有着二十年硬科技投资经验的兰有金,曾投资了睿创微纳、亮风台科技等半导体和AI企业。在他看来,不少AI芯片公司采取“倒推式”来预判市场需求后,再推出定制化的芯片,这种方式一定程度上解决了芯片商业化的问题,但芯片设计要求高、周期长,一旦预判失误,或者业务模式出现变动,就会前功尽弃。
兰有金以去年风靡一时的“炒币”现象为例。不少矿机公司为了尽快挖币,在市场上推出了算力更强的专用AI芯片,但随着大量区块链项目停摆以及币价大跌,这些矿机公司押注的AI芯片也渐渐在市场上无人问津。
拿下客户
即使 AI 芯片尚属于新兴产物,但在诸多厂商的量产计划中,“百万级”已经成为证明自身行业地位的一个基础指标。
云知声CEO黄伟曾在旗下物联网 AI 芯片“雨燕”发布时表示,已经拿下京东、美的、格力等厂商订单,平均每年芯片出货量有几百万;Rokid 创始人Misa 也曾谈到,其推出的AI 语音芯片KAMINO18 已达百万级量产。
出门问问CEO李志飞也对这门生意寄予厚望。在他的规划中,由出门问问去年推出的AI 语音模组“问芯”为重要组成部分的To B软硬件方案,将进一步落地至智能家居、车联网等终端场景,这会成为这家以可穿戴产品著称的AI 消费级公司新的增长点。
“目前 To B 产品只占公司营收的10%左右,我们希望在2020年,这个数字会上涨到30%。”李志飞对钛媒体表示。
这并不容易。诸如华为、苹果这类一手推芯片、一手握产品的硬件公司,单凭自产自销就能保证旗下芯片有着固定的销路;但对于新兴AI 芯片厂商来说,如同新生儿走出襁褓,当AI 芯片脱离技术创新的摇篮,成长为具备商业价值,得到客户认可的标准化产品,它需要接受的市场检验一点都不会少。
试错是必须要经历的过程。在 Rokid 杭州办公室,周军向钛媒体展示了一项技术成果:一块搭载 KAMINO18 芯片的开发板。这块不足手掌大小的电路面板将芯片、麦克风、WIFI 模块等零部件集成在一起,相当于一款没有外壳的智能音箱。而周军团队最重要的工作,就是成千上百次地检验产品:有没有共振、漏音;电流会不会出现异常;拾音距离是否足够?
在检验完毕后,终端厂商只需在面板外部罩上外壳,即可制作成一台具备语音交互功能的智能音箱。这种半成品式的硬件方案的确更受客户欢迎,“相当于客户可以直观地看到产品了。”周军对钛媒体说。
技术团队埋头迭代产品,商务团队则忙着与客户“算账”。
在技术体系外,地平线成立了单独的智慧零售事业部,团队成员多来自化妆品、服装、奢侈品等零售行业,这源自陆晓明的要求:“能和客户讲一样的语言”。
算账就是一类很重要的话术。部署地平线的人脸识别摄像机能帮零售客户省多少钱?陆晓明掰起了指头:首先是功耗不同,普通摄像机20W,地平线人脸识别摄像机为4.5W,假设一座商场内部署1000架相机,一年可以省5万元左右。
其次是本地网络基础设施费用的减少。通过边缘AI芯片,地平线将识别、抓拍和客流等计算分析做到了相机端,需要传输的是计算过的数据,所占带宽就很少,百兆带宽的局域网就足够;相比之下,传统摄像机需要将视频流传回服务器,单台所需带宽就在4Mbps以上,核心网络设备需要支持千兆甚至万兆的数据交换能力,成本又差了10倍以上。
除此之外,可以减少的成本还包括了省掉的本地CPU/GPU服务器支出、在商场架设服务器、UPS(不间断电源)与恒温设备的费用,还有雇佣维护工程师的工资——在陆晓明的账本上,这些为零售客户省下的项目开支达到了100万元。
“零售客户才不在乎什么芯片不芯片。”陆晓明对钛媒体直言,“客户的顾虑在于,你懂不懂我的行业、解决方案落不落地、性价比高不高。”
落地、拿单、谈客户,这样的商业化能力也正成为资本考察 AI 芯片公司的重要指标。
“如果投资一个纯粹的CTO,再为他搭配一个CEO去 sell(销售)产品,这是很难的,投资人也比较忌讳这个事儿。”建投华科董事总经理戴燚告诉钛媒体。建投华科是中国建投旗下专注于信息技术产业的投资机构,也是地平线A+轮的投资方。
戴燚用“接地气”来形容地平线CEO余凯的办事风格:“很多外企海归回国创业,谈客户的时候都是直接问能不能给单子,不能给转身就走。余凯不是这样,他能做到和政府、国内企业客户无缝衔接,这一点很难得。”
从戴燚这样的资方视角来看,AI 芯片要想彻底覆盖自动驾驶、安防、零售、硬件终端等场景,依然需要一段教育用户的时间。在该过程中,各个产业也面临生态内不同角色的配合。
以自动驾驶来说,AI 芯片的落地,势必要涉及tier1与主机厂的合作、交管部门的政策影响等因素,这就需要芯片厂商在技术之外,具备更综合的全局协调能力。
“要学会当一个产业人,而不是一个独角兽。”戴燚说。
两种矛盾
自90年代起,以紫光集团、华为海思等为代表的国内传统芯片公司逐一诞生,至今已历经数十年发展,已形成一套标准的芯片设计、制造、封装流程,但在具体的CPU运算效率、芯片核心制造工艺仍与美、日等发达国家存在差距。去年4月,中兴遭美国下发七年出口禁令后业务全线停滞,由此在业内引发“缺芯少魂”的危机讨论。
如今,AI 芯片公司受场景需求启发,企图用算法注入芯片的手段实现中国“芯”公司的弯道超车,可这一新兴路线正遭遇双重矛盾:生产环节,AI 芯片容易陷入“量产耗时长,算法过时快”的困境;销售层面,又面临“供给侧(AI 芯片厂商)凶猛,需求侧(终端客户)冷静”的现象。
“流片”成功与否是决定芯片成败的决定性因素。所谓“流片”,即“试生产”,是在电路设计后,先生产少量生产芯片用来测试,通过后再进行大规模量产,这一过程往往需要1-3年。
由于耗时长、投资大,一颗芯片的流片往往会关系到创业公司生死存亡。余凯就曾在地平线流片结果揭晓的前一天,和团队前往雍和宫烧香。“如果流片失败了,几百万美金就打了水漂。”余凯曾说。
流片前的市场预测就变得至关重要。李志飞告诉钛媒体,做一款APP只需要预测消费者6个月后的需求;做软硬件要预测12个月;而做一套芯片模组要以3年为周期来预判。
谈及芯片前期设计环节的预判难点,兰有金与戴燚使用了同一个形容词:“鸡同鸭讲”。
传统半导体对芯片的定义更多在后端运算层面,当中的芯片定义、设计、制造等环节多由硬件工程师来完成;但AI芯片除了兼顾原有的运算功能,更讲究与AI 算法的融合,有时还需要与前端软件形成联动,这就需要算法、软件科学家与硬件工程师共同参与。
“半导体硬件工程师更讲究IP、架构等,再加上中国有很多AI场景是被硬推出来的,成熟度不够,就很难对应用场景有深度理解。”兰有金对钛媒体说。
兰有金以一个案例形容两种角色间的分割:比如一项应用在军事领域的AR项目,参与方有芯片设计工程师,也有专攻AR应用软件算法的科学家,两方是各自领域的专家,但合作时对彼此需求理解不够,“很难聊到一起去”。
另一方面,来自企业需求侧的前期反响,更是让本就前路坎坷的AI 芯片多了几分不确定性。
“谁都会担心自己成为第一个白老鼠。”周军说,他收到过来自客户对于AI 芯片的各种疑虑:有没有量产过?装进产品后出问题怎么办?下单后产能会不会跟不上等等问题。
但让周军感到鼓舞的是,由于 Rokid 本身就是智能音箱的生产者,一方面更能响应客户需求,另一方面,其生产的芯片也能“自产自销”至旗下产品,也就减轻了一部分芯片滞销风险。
“(市面上的AI 芯片)同质化太强,体验上的差距并不明显。”刘峰这样评价当下的AI 芯片产品,他认为目前问世的几款AI 语音芯片,不管是功能点上的远场识别、多轮对话,还是性能上的高集成、低功耗,这些厂商主打的各项指标都有诸多相似之处,这些都会影响终端厂商对AI 芯片的采买意愿。
“芯片这种硬科技产品,必须在某个技术维度大范围超出对手,才能持续性地获得客户认可。”兰有金表示。
参与方的认知磨合、需求方的冷眼观察,再加上早期事物的发展无章可循,都让AI 芯片的投入产出比难以预测,对于各路玩家来说,眼下无疑是一个“花钱买路”的必经过程。
“在商务上我可以不赚钱,我们做得事情就是不停地告诉客户这是未来,然后一起合作把芯片推出去。”李志飞说。
资本自然成了这一环节的重要推手。那些更早、更快拿下融资的AI 芯片公司正逐步展现出光环效应。
戴燚坦陈,小规模的“算法+芯片”团队试错机会越来越少,他们手中的钱只够单次流片;但头部芯片企业,可以在短时间内连续进行一代、二代、三代不同算法配置的流片,不论是迭代速度还是研发积累,头部企业的优势只会愈发明显。
对于AI 芯片领域的未来,戴燚仍充满希望。他看好AI 芯片在自动驾驶、安防市场的巨大潜力,理由是这两个场景前期已有半导体芯片的能力渗透,而AI 技术可以让原先的能力变得更强,这种逻辑折射到应用规模上,就变成了一个“可以从200亿涨到400亿”的好生意。
“一批投资人砸了这么多钱进去,一定会把这个产业推向下一个高度。”戴燚说。顿了顿,他又补充到:“就算不是到月亮那个高度,也是地球近地轨道那个高度吧。”(文中“张凡”为化名。)