我们仍处于AI前夜。“人民日益增长的人工智能需要同落后的产品现状之间的矛盾”如何调解?这位阿里老兵选择了“嵌入式AI”的路,以此期待能在AI前夜过去、时代真正到来时依然屹立。
作者|伍小仙
编辑|欧拉拉
网址|www.xtecher.com
微信公众号ID|Xtecher
处在AI前夜的我们
判断当下什么最火,有一些简单粗暴的方式:
几年前以“大数据”为主题的大会,如今都改成“人工智能”主题的大会了;几年前产品命名都是“XX data”,如今都改成“deepXX”或“XX.ai”了;数数如今垂直于AI的媒体有多少家、每天发多少条“重磅”,就会显而易见地看到:人们怕被时代丢下的焦虑感已被煽动起来了——人工智能似乎进入到一个惊喜频现、日更夜迭的群体高潮阶段,从创业到两会,从学界到业界,无人不蠢蠢欲动。
“AI创业潮,是种必然。”在有着十多年AI研究经验的赵京雷眼中,一切是趋势使然:
首先,是移动互联网发展带来的巨大数据红利,紧接着,是计算能力伴随着GPU及各种芯片发展显著提升,随之,市场需求开始觉醒——医疗也好,金融也罢,很多垂直行业在获取了大量数据之后都想着怎样从数据中挖掘更多价值,思考能否利用新兴技术提升工作效率、降低成本……这些变化,暗暗驱动AI快步前进,亦在某种程度上催生了现在的“AI创业潮”。
然而,AI企业不断涌现,估值一波高过一波,似乎给人们造成了一种假象:AI应该解决大部分问题,甚至公众会以大白、BB8这些影视剧中的机器人作为参照物,希望当下AI产品能像它们一样,如同一个自然人般跟我们互动。与此同时,知乎上却有人发表这样的观点:“市场上所出现的种种AI产品,看起来很土,用起来很傻,什么人工智能?根本就是人工智障。”
——这便构成了人民日益增长的人工智能需要同落后的产品现状之间的矛盾。
“或许你会很失望——我们总是期待AI可以迅速重塑商业,改变人们工作和互动的方式,但很遗憾,以现在的技术很难让机器具备人的同等能力,AI还有很长的路要走,处在AI前夜的我们,所做的一切都是在不断夯实行业的基础架构,只有当有人潜心去做这些很笨拙的前期工作,我们才迎来真正的AI时代。”阅面科技创始人赵京雷如是说。
“AI前夜”究竟何时才会结束?没有人能给一个准确的答案。赵京雷告诉Xtecher:不仅AI从业者,所有人都应该回归理性。
如果AI时代的到来是以AI引起人类生活的大变革作为标志,那么,机器是否能跟人完成自然交互,则是判别机器是否真正智能的标准。
赵京雷告诉Xtecher,他在三年前就意识到这件事,也将此注入到阅面的发展中。
“回去搞AI吧!”
“如果接下来要创业,做点什么好?”
2014年下半年,赵京雷在一次聚餐中跟几个搞技术的兄弟聊开了。
那时,他刚刚结束了上一个创业项目,聊天结束时,他突然意识到:不管是AR还是VR,所有新一代智能设备的本质都在于智能体验的提升和更加优质的交互。
筹备半年后,他于15年7月正式成立了阅面科技。
赵京雷,前阿里巴巴北京算法研究中心负责人,前WiseNut研发中心算法负责人;毕业于上海交大,在研究生和博士期间主要从事机器学习和自然语言理解方向的研究,专注AI领域算法研究超过15年。
2013年,赵京雷从阿里离职,开始了自己第一个创业项目——上街吧。上街吧APP主要做搭配推荐和虚拟试衣,通过推荐和搜索技术,以图像处理技术为基础,帮助女性学习穿衣搭配。一年时间,上街吧关联微信公众号拥有粉丝100万+,团队步步壮大,表面上看起来市场一片火热,赵京雷却觉得:移动互联网这一波浪潮,基本已经到头。
“回去搞AI吧!”
他毅然结束了势头正劲的移动创业项目,回归到自己熟悉的AI领域。跟随他的,还有丁小羽,前卡耐基梅隆机器人研究所研究员,东南大学计算机视觉博士;宋向明,前百度高级架构工程师,上海交大计算机架构硕士——大伙儿都来自那次“聚餐”。
三个技术男,加上来自上海大学的陈婧,构成了阅面科技最初的几位元老。
人凑齐了,干AI,从哪下手?
从“嵌入式”入局
阅面科技的技术优势主要在于“嵌入式视觉”——基于深度学习技术,为智能机器和设备提供嵌入式视觉解决方案。
阅面的嵌入式视觉重点关注设备端的计算,一方面不依赖于云端,在设备端实时本地化运行,保证视觉计算的动态实时性和可靠性;另一方面,在未来可以和云端配合进行部署,给嵌入式视觉领域提供最优解决方案。
2015年,某种意义上说是移动互联网时代的分水岭。这一年,O2O经历顶峰之后开始遇冷,移动互联网的红利期过去。与此同时,无人机爆发,机器人公司大批成立,消费和民用市场出现了大量的智能化需求。
彼时,国内同类公司大都是基于云和服务器搞研发,面向的主要领域为金融、公安、城市安防,而正是看到了计算机视觉在消费级和民用市场的应用这片蓝海,赵京雷当初才果断选择“下水”。
为什么选择“嵌入式”?
17年初,地平线和英特尔联合在CES上展示的ADAS产品,是地平线在英特尔的FPGA平台上实现的自主研发的低功耗深度神经网络处理器架构IP,即第一代嵌入式AI处理器架构IP——高斯架构。
这次发布,使得“嵌入式”概念获得了大范围关注。而此前,嵌入式AI一直是AI业界的“非主流”。
嵌入式AI与当前联网状态下的AI相对应,是指在本地进行实时环境感知、人机交互与决策控制,而非通过联网和数据中心的大规模计算来实现AI。地平线创始人余凯曾在接受采访时表示,嵌入式AI会使得自动驾驶系统无需将信号传送到云端再做决策,用时更短,不受网络情况影响,对自动驾驶领域有重要意义。
阅面的“嵌入式”与地平线的“嵌入式”有同类优势:以实时分析人群属性为例,当视觉数据量很大,要做实时数据处理时,常规做法是使用一台或多台包含大体积GPU的服务器处理,导致信号实时传输能力大大削弱,且部署非常麻烦。但如果改用“嵌入式视觉”,这些困难都将大大简化。
但深度学习模型比较复杂,在普通芯片端高效运行技术的门槛比较高,基于深度学习技术做嵌入式视觉的企业很少。阅面下水的时间较早,成立时间和国外同类企业相差无几。
“如果我们在芯片端能做到百元级的价格、手指大小的空间,可以想象这会带来多么巨大的改变!”
以上优势都让赵京雷信心满满。
三步走
光有好布局还不够,赵京雷给阅面科技定了“三步走”的路子:
第一,抓算法模块;第二,搞集成服务;最后再冲击数据服务。
底层算法的成熟需要经历一个漫长的优化过程。现在,阅面已经走到第二步——将产品从最初单一的ReadFace(面部识别)发展到ReadHand(手部识别),ReadBody(人体识别)及ReadWay(场景识别)四大系列——从只利用大数据深度学习技术,帮助机器识别、跟踪用户的脸部特征,到现在已经可以帮助机器识别并跟踪用户的手部特征,识别并跟踪用户的人体特征。此外,阅面的解决方案还可以让机器智能感知周边环境。这就是阅面潜心打造的嵌入式视觉系统的底层算法生态圈。
目前,阅面科技部署在云端的人脸识别算法精度已达到99.7%;迁移至嵌入式端,可以在低至1G的Arm CPU实时运行,并达到98.5%准确度。
近期,阅面科技基于Arm架构芯片在原有软件的SDK产品基础上,推出了三款低成本嵌入式软硬件一体产品:
视觉交互模块:国内首款通过单目RGB摄像头实现的视觉人机交互嵌入式模块。软硬件一体集成了人脸识别、人体追踪以及手势识别等多种必备的人机交互视觉技术,可用于机器人、门禁系统等。
视觉避障模块:国内首款通过单目RGB摄像头实现的视觉避障功能模块。软硬件一体集成了单目测距、避障等空间感知功能,可用于扫地机、无人机等。
智能人流分析终端:实时对人流的数量、位置、轨迹进行统计和分析,并支持人群属性分析以及识别等。不依赖于服务器,可完全前端部署,支持SaaS对接,超低成本和功耗。可用于家庭、楼宇、店铺和商超等。
阅面新产品图片
已经走好前两步,接下来,阅面希望以自己的集成方案为基石,进入第三步:提供数据服务——在走好前两步的基础上,利用自己的产品采集独特的数据,再基于这些数据构建更完善的,旁人无法提供的数据服务,帮助AI企业解决深层次问题。
三步走,步步稳扎稳打——做好算法模块,成为最好的嵌入式视觉公司;完成产品集成服务,冲击最好的识别企业;提供数据服务,看向最优秀的AI企业。
谈产品,谈公司时,赵京雷反复说:“抓住时机,用正确的方法做正确的事儿,这是阅面的立身之本。”
商业
“如果有人想要投资阅面,我希望他们不单单是出于对阅面技术的认可,更是出于对阅面商业模式的认可。”赵京雷告诉Xtecher。
这是赵京雷在阿里时期就养成的一贯思维模式:“是否考虑到未来的商业模式几乎决定了你能否成为一家伟大的企业。”
阅面科技以to B业务为主,将他们的模块和算法融入到合作方的产品中,为企业和开发者提供一系列人机交互和环境感知的视觉解决方案,成为AI产品落地背后的助力者。目前,阅面已经与公子小白、BroadLink、TCL通讯、创维、中兴通讯、中科创达等几十家公司达成合作。
左手技术,右手商业——阅面在他的带领下,不到两年时间就从最初的4人团队发展到40+人团队,并在上海、南京、深圳、明尼苏达成立了四个分部。
如今,阅面科技已顺利完成两次融资:2015年获得栩远投资的数百万天使资金,2016年获博将资本和索道资本等多家基金投资的数千万人民币A轮资金。
在日益激烈的市场中,阅面科技拿什么跟别人竞争呢?
“技术定位清晰,兼顾商业模式,下手也早!”赵京雷很自信。
阿里给他的“财富”
为什么阿里可以造就那么多创业者,甚至让“阿里系”成为创业者中的强大派系?
“一是因为阿里的生态体系很大;二是因为阿里非常开放和商业化。”赵京雷说,这是他跟朋友一直探讨后得出的结论:阿里的生态体系很大,涉及方方面面,阿里人在工作过程中总能看到一些小的可以“做点事儿”的领域。再者,阿里的文化本身就无限逼近创业,“马云,一个英语老师都能开创这样的阿里帝国,还有什么是不可能的?”
谈起阿里,赵京雷脸上洋溢着笑容。
出生河北的赵京雷大学毕业后在一家石油公司工作了两年,随后进入上海交大,完成了硕士、博士学位攻读;博士毕业后,他在WiseNut做了三年算法;然后进入他创业前的最后一站,阿里巴巴。
令他印象最深刻的,是最初进入阿里时接受的培训。
“描述你‘第一次’的地点和感受。有没有使用过某个特定的姿势?”一个个让人羞于启齿的问题和厚重的阿里传奇故事以及繁复的阿里业务知识贯穿培训始终。
“就像被剥光了一样,让你迅速融入团队。当时可能只是觉得新奇,出来的时候才发现世界观都变了。”
赵京雷这样形容阿里带给他的改变:绝不仅仅是变得越来越胆大,更是改变了他对工作的认知。进阿里之前,赵京雷仅仅把工作当成工作,但是做着做着,工作就变成了事业和梦想。
阿里也改变了赵京雷的目光,曾负责整个北京算法团队的他,在阿里开放而注重商业的氛围之下学会了从用户、产品角度考虑技术问题。而“共享共担”的团队合作精神也是他收获的宝贵财富。
现在的阅面科技也十分强调“共享共担”。
“关于阅面,我印象最深刻的不是拿了多少钱、捧了多少奖,而是当初整个技术团队像亲兄弟一样以公司为家,没日没夜加班,终于在一年半时间内把底层算法做出来了。”
这个平时被团队成员亲切称呼为“雷哥”的男子平日在公司是“堵枪眼的”——哪里出现问题,懂技术、懂产品、懂C端的他都能补上去。
几乎每一个阿里系创业者带领的公司,总有一些阿里的影子。赵京雷坦承,阅面强调的团队合作、坚韧等价值确实带了一些阿里的味道。但这家成立两年多的公司,在强调“技术驱动+商业模式”的同时踏实且坚定地走在自己的路上。
智能的眼睛
有十多年互联网从业经历的赵京雷是互联网发展的直接见证人:第一波互联网浪潮袭来,催生了以新浪为代表的大批“门户网站”;第二次互联网浪潮袭来,BAT等“平台”应运而生;第三次互联网浪潮到来,以滴滴为代表的一批中国“独角兽”企业得以成长;终于,第四波互联网浪潮来了,“智慧化”技术和商业注定再起风云。
暗潮涌动的时候,谁嗅觉更好,谁下手更快,谁就最有可能抢占市场。
“随着芯片计算速度以及算法实时性、稳健性的要求,部分计算能力向芯片端计算的迁移是必然的。随着价格的下降,计算模块体积和功耗的降低,计算机视觉在消费级和民用市场的应用正在爆发。”
看准这片市场的赵京雷,想要通过深度学习技术赋予机器一双智能的眼睛。
“不论外界评论如何,不论资本走向如何,AI的核心——技术是始终向前发展的,虽然我们不知道AI时代何时会来,但AI一定会在未来某天颠覆我们的生活。”
向来很佩服乔布斯,骨子里同样有很深C端情节的赵京雷说,他希望阅面的技术可以带给机器一双智能的眼睛,帮助机器实现更加自然的交互,让我们所处的世界变得更加高效。他希望能带领阅面在AI前夜站稳脚跟,也能AI时代真正到来时依然屹立。