从军事到民用,如今进入工业领域,AR技术在寻找道路的阶段逐渐完善自我,也为开启第四次工业革命提供了一把钥匙。
亮亮视野通过“田野观察”找价值点,用“灯塔模式”在单个行业中逐步扎深,再回到战略层面的认知——吴斐认为,AR最重要的是连接了人和数据。
文|罗宁
编|王一粟
AR领域并不是一个新鲜行业,和很多技术经历的发展历程一样,其起初也从军用领域开始,但半个多世纪的产业变革,让这项技术逐渐迈入大众视野,而其中的每一步,都走的不像我们设想的那样简单。
1968年,世界上第一个头盔显示器“达摩克里斯之剑”在美国ARPA信息处理技术办公室诞生,这款大而笨重的军用头盔显示器最初的作用十分有限,且由于太重而无法移动使用,但人们第一次看到数字世界以一种完全不同的视角呈现在人眼前。
如同字面意义一样,“达摩克里斯之剑”最大的缺点在于重量,过于沉重的头盔不但无法让人四处佩戴,也让实用性大打折扣,但其内涵的概念却影响至今,正如发明者Ivan Sutherland博士在《终极的显示》一文中提到的那样,这是一个"观看虚拟世界的入口"。
随后的半个多世纪,当计算机技术、人工智能技术、互联网已经开始成为我们生活中不可或缺的部分,我们不但看到了这个虚拟世界,更是身处其中无法自拔,电脑、智能手机、智能音箱的普及让更多人意识到虚拟世界的力量,而AR技术也在这一时期迎来了自己的第一个高光时刻。
随着大洋彼岸的Google Glass以及HoloLens横空出世,无数普通人希望自己能够成为《头号玩家》中的一员,而随后的行业低谷期则告诉所有人,AR并没有大家想象中那样完美,它还需要时间,这时摆在所有从业者面前的问题是:
AR的真正价值究竟是什么?
带着这个问题观察AR行业的众多从业者当中,来自中国的创业公司亮亮视野找到了自己的答案。在行业低谷期成立,将目光瞄准工业和安防领域并取得成功,如今又在航空、能源、安防、建筑领域多点开花。
为何这家中国公司能够抓住AR行业的机会?又是如何能够在行业低谷时期迅速成长?带着这些问题,光锥智能专访亮亮视野创始人&CEO吴斐,也让我们看到一家中国AR公司的独立思考和成长轨迹。
技术回归与"田野调查"
2014年,亮亮视野成立初期,吴斐面临的首要难题之一,是当Google Glass这样关注度极高的产品出现在大众面前,一个新公司要进入AR领域,应该如何寻找切入点?为了回答这个问题,他将思考的重心回归到AR原点:
“最开始AR是在军用领域,在所有人都在做消费应用之前,AR是不是应该在工业、军事领域等B端、G端先产生价值?”
带着这样的结论,亮亮视野开启了最初的“田野调查”,他们组建了一个ODD团队(One Day Demo),每天做出一个应用场景,以探索AR和不同行业的结合,也在寻找一个突破口。在这个时候,医疗行业远程手术直播进入他们视线。
“在中国,医疗行业的优质资源稀缺,无法形成(需求)覆盖。”吴斐表示,对于医疗领域,AR能够为医生提供第一视角的宝贵资料,这件事的潜在价值巨大,团队也正好借此机会能够进入医疗健康赛道,亮亮视野成为“中国首个智能眼镜手术直播”的技术公司,但作为“田野调查”初次尝试,他也发现了切入这一行业的问题:
“其实主任做手术,他们只做最关键的步骤。手术时刀口是别人切的,止血是别人做的,准备工作做好以后主任再上来做,然后告诉助手要把哪里缝合哪里做处理,所以给他戴眼镜记录的第一视角并不是全过程。不是全程就没有什么意义,所以就给他助手戴,但记录下来的也只是助手的视角。”
在吴斐看来,这样的尝试“只是打了一个很小、天花板很低的市场”,但却依然让团队看到了AR在消费级市场之外的可能性,并认识到光学、AI技术对AR公司的重要性。
蓝驰创投董事总经理曹巍就提到,亮亮视野在早期就开始对AI算法和光学研究进行投入,这种技术底层积累对创业公司的长期发展影响深远:“AR在底层技术上有两个分支是非常关键的,一个是光学研发能力,另一个是基于AI在特殊场景的算法模型优化和研发能力。亮亮视野和中科院自动化所、浙大光电学院,通过深度合作的方式联合研发突破一些前沿难题,再把它放在业务实践里去完成,这也是很关键的底层技术积累。”
这样的积累带来了产品力上的提升。面对AR头戴设备笨重、发热量大、运算效率低等问题,亮亮视野一方面将部分运算处理任务转移到手机以降低眼镜重量,另一方面率先将英特尔Movidius Myriad 2芯片应用于智能AR眼镜终端,使其相较于过去具备更强的计算能效比,从而更好控制机身发热。而在镜片上,追求超清、超薄、高透光性、零漏光的阵列光波导技术成为其研究重点,并在之后实现了规模化量产。
这些回到AR技术原点的“基本功训练”,不但提升了亮亮视野在产品上的优势,也为之后的“田野调查”提供了更多可能。
安防是一块巨大的万亿市场,也让亮亮视野看到了新的可能。
在人流量巨大的火车站、机场,亦或者是车水马龙的交通要塞,如何快速甄别犯罪嫌疑人?结合人脸识别的AR眼镜便能实现。在任务执行期间,AR能为民警显示叠加在眼前环境中的3D信息,快速比对数据库,不仅提升办案效率,也能降低操作失误。
四川省雅安市荥经县当地警方在从2018年起开始,采用基于亮亮视野AR技术研发的“禁毒稽查路控系统”来完成来往车辆人员的甄别。民警只需要佩戴一副AR眼镜,朝车内人员和车牌看上一眼,便能在信息库里快速比对是否有犯罪记录或吸毒史等相关信息,随后显示在和眼镜相连的手机上,误识别率只有千万分之一。
这一过程相比过去的问询盘查,从5-10分钟时间缩短到到1秒左右。对于民警来说,更快更准确的检查意味着更高的办案效率,在AR眼镜以及AI技术加持下,原本看起来繁琐的过程变得有些 “科幻”,让罪犯难逃法网。
“我们把自己定位成企业服务专家,这里面关键是服务。怎么理解服务?就是要在每个关键点都要打通,去做AR技术的改造和创新,把专业知识形成数字化的解决方案。2016年都在说‘聚焦’,我们需要先去打通场景,再从场景跳出来去思考怎么做更具广泛性的平台。”
先思考战略,指导战术落地,再回归战略。这种模式让亮亮视野不仅建立起基于AR交互的多个新场景,并延伸出了AR技术的应用边界。
吴斐提到,当这一阶段之后,亮亮视野更明确自己的定位:“亮亮视野(的产品)不是一个硬件,而是一套完整的系统,是建立在知识图谱和AR交互上的应用。”
从场景出发做技术创新
AR领域一直存在着“AI一思考,眼镜就发烫”的说法,作为深度融合AI与AR技术的前端产品,AR眼镜不仅仅需要企业对光学领域持续不断进行基础投入,也必须将AR、AI和具体场景结合的底层场景持续挖掘,即便是最有经验的谷歌和最有资源的Magic Leap也还不能在这两方面同时成功,那么亮亮视野的秘诀究竟是什么?
从使用场景出发,亮亮视野把解决轻量化问题放在了核心。轻量化的实质是将一台支持AI技术的计算机塞进几十克的眼镜中,要在保证性能的同时降低发热,尽可能让佩戴者长时间使用——这对于产品的研发是一项巨大考验。
因此,来自英特尔的Movidius Myriad 2芯片才会出现在亮亮视野的AR眼镜上,作为最早吃螃蟹的公司,这款芯片成为亮亮视野“破局”轻量化的重要一环。这颗只有9.5mm*8mm的VPU拥有相对传统CPU架构5倍的计算能效比。目前这颗VPU已升级到Movidius Myriad X ,可提供每秒万亿次的计算性能,功耗却不到1W。
但仅靠VPU硬件提升计算能效比还不够。尽管Movidius VPU硬件相对成熟,但其工具软件链不成熟,一些关键算子的运算效率较低。亮亮视野团队基于Movidius VPU硬件自主研发了Laffe引擎,对关键算子进行汇编级优化,部分算子比英特尔官方实现速度快了2-10倍不等。采用VPU硬件和Laffe引擎软件加速,亮亮视野获得了相对于CPU的15倍计算能效比提升。
为场景不断升级革新的另一个突破在光学部分。2020年5月,亮亮视野发布并使用上了超短焦AR光学模组“八面体”。这种超表面技术不但将光学模组重量降低至9克,还实现了低功耗、高透光率以及零漏光。当技术落地,亮亮视野第一时间发布了Leion Pro这款产品,其85%透光率、4000nits最高亮度、10000:1对比度、3600PPI、100%sRGB、<1mm透视偏差成为行业领先,都让亮亮视野打开了更多使用场景。
“AI要从底层改造,需要重新考虑产品功耗和性能比。从人、场、物的识别,再到未来的数字孪生、知识图谱的构建。未来AR技术会以‘知识渲染’的方式来让使用者感知现实世界。”吴斐表示,亮亮视野把产品创新和场景探索深度融合在了一起,这也是目前其多个产品线并存,覆盖十多个领域去进行服务的原因。
以上这些场景,仅仅只是AR扩展场景的其中一小部分,伴随AR设备轻量化和更快算力的加持,新的AR设备将能脱离网络,在离线时继续工作。亮亮视野的产品已经真正实现了从目标检测、追踪到识别,所有AI计算都部署在眼镜终端运行。吴斐透露,以安防中的多人脸动态识别为例,这样部署计算能够保证即使在通信网络中断的情况下,AR眼镜仍能通过完全离线的方式执行人脸识别等基础任务,响应时间则在毫秒级别。
伴随场景的深度学习算法升级也是亮亮视野可以切入企业服务,快速落地生根行业应用的“杀手锏”。近年来深度学习在计算机视觉领域的应用已经非常成熟,也已经成为AR眼镜产品的标配。亮亮视野团队采用剪枝、蒸馏等技术对冗余的算法模型进行压缩。依托VPU和Laffe框架,利用神经网络压缩技术,对具体算法辅以针对性改进,实现了AR眼镜上计算能效比的大幅提升。以人脸识别算法体系为例,亮亮视野团队一共约取得了相对CPU计算基准的50倍计算能效比的提升,从而在低功耗的AR眼镜上实现了AI算法实时运行。
在吴斐看来,十年前iPhone刚起步时或许存在很多不成熟,但其创新之处在于找到了成熟技术和场景结合的变革可能。已经半个多世纪的AR产业也是如此,如今在技术上,目标识别、远程协助等其实都已成熟,但如何创造与革新才是行业重点。“让很多功能跑到一个这么轻的并行计算平台,如何在这上面用更小的模型实现,到底解决了哪些问题,我们都要踩着基础技术的肩膀往前。”
正因如此,修炼好内力的亮亮视野,才得以在一次次场景服务中发现用户痛点并加以解决,从而真正通过硬件创新解决了客户面对的技术挑战、安全挑战、效率挑战等一系列问题,在改造与创新背后,技术服务场景的价值才被越来越多人关注到。
螺狮壳里做道场
Facebook AI研究院首席AI科学家Yann LeCun曾指出,“AR眼镜有机会成为机器学习从业者的理想挑战目标,因为它涉及许多尚未解决的问题。在低功耗的AR眼镜里实现高效的AI运算,颇有些螺狮壳里做道场的意味。”
要在螺蛳壳里做道场的亮亮视野,在2017年迎来了其商业领域的重要合作——与优信打造二手车检测业务,谈到这次合作,吴斐认为他们看到了AR在B端市场的真正价值:
“优信希望每个员工都能像最顶尖的汽车专家一样去思考去检查。因为检查一辆车,怎样能在15分钟看出进没进水,维修过没,撞过没,都是最初存在于少数人的意识经验里,这是很多优质专家的技能,他们可能看了几眼就比别人更能判断出车况,但怎么把这种知识结构让其他人掌握,这其实是AR应用领域真正的知识图谱1.0,就是要把人的知识挖掘透彻。”
对于亮亮视野而言,与优信合作不但变革了过去专家传授经验的方式,更重要的发现了人与车产生数据的潜在价值。
“当产生几百次这种真实数据之后,优信反过来发现这可以用来评价人和车。比如人的效率高不高,是不是在检查中作假了,这成了评估人的业务能力的一个参考;另外车也可以判断,比如哪些车很快卖出去了,就能判断车的销售和车况关系,输入输出如此完整,这个数据就为优信建立一套完整的评估体系提供了基础知识数据。”
对于民航、工业、建筑、汽车等行业来说,积累系统知识,建立知识图谱至关重要。企业中高级人才变动往往意味着知识流失,如何把这些经验和知识加以保留,AR与AI的结合为他们提供了答案。AR设备在远程协助上的优势,可以帮助新手快速学习专家的经验,另外一方面,即便一些资深专家退休,AR设备的存在也能直接将他们带往现场,这在过去也很难实现。
图灵的老师维特根斯坦在他著名的《逻辑哲学论》里写道:“世界是事实的总和,而非事物的总和”,这其中的事实是事物之间的关联。过去人们在生产实践中对于这种关联的把握更多需要依靠实践积累,而AR的数字化变革将专家经验更进一步转化为知识图谱,并和人工智能深度融合,最终成为许多企业源源不断改进和创新的知识积累,以此为基础,亮亮视野从汽车检测扩展到飞机检测,实现了和业内多家一线民航企业的重点合作。
“当我们把车换成飞机,把车检员换城机检员,有了AR这种知识图谱方式,很多人第一次感受到了这种把人和知识连接在一起的力量。比如民航企业检查飞机之后,能知道谁检查更快、谁检查慢,能立即知道这个飞机是不是静电刷特别容易掉,飞到哪条路线上特别容易被鸟撞,这些都可以在以后检查的时候实时看到最新数据,这是打动对方的地方,他们看到了数字化转型的价值。”
亮亮视野在民航领域的探索,也成为其商业实践中“灯塔模式”的标志性事件。
“第一期的产品更多用作在机场远程指导作业,并把过去的标准工作AR化。然后发现,有许多在实际磨合中产生的改进和新增需求,比如远程指导时,后台专家看时间长了会头晕,那我们就需要做新的算法来防抖;而在有些关键节点上,专家也希望能看到一线人员是否真的把工作做好,比如一些螺栓是不是真的拧紧,这些事情我们就用AI来验收。我们专门拿出一部分预算来做训练,用迁移学习的方法可以训练到一个非常高的准确度,下一阶段的目标就是所有验收的工作都能让AI完成。”
“当把所有验收、作业指导做好之后,我们从数据的外延看该怎么去和机型做连接,该怎么和每一次飞行任务连接,怎么和人的能力等级、和主管连接起来。于是,我们开始做预测修型AI,如果某个一线的人突然换岗,那之后的人要怎么做?我们想让一线员工都能成为非常聪明的操作者。第三期的目标是把机务打通,目前来说还是在连接阶段。”
吴斐提到,与民航公司的合作项目一共进行了三期,前期三个多月探讨中,大家对于AR能做的范围一直在扩展。一期做完团队对二期的理解马上和做一期之前不一样了,当二期做完团队已经知道三期应该怎么调整,而这次合作也让亮亮视野发现了AR在民航领域的巨大市场,最终,亮亮视野准备为这一领域带来更全面的解决方案并推向整个民航业。
“最开始以为这只是个别公司的需求,后来发现整个航空领域都是如此,所以为什么最后我们把目光聚焦在AR行业灯塔,就是发现这一类项目还是不要太着急,AR的终极答案远远超出我们想象,应该先专注于当下这些项目把它做实做透。”
这次合作,也让亮亮视野看到中国工业数字化转型背后的庞大市场需求,在吴斐看来,中国在很多领域对于AR行业的需求都像这家民航企业这样切实存在。而伴随对这些行业的深入合作,更多中国企业有机会成为具有世界级影响力的品牌,“今年中国民航客流量已经是世界第一了,以现在的投入来看,很快就会走到世界前列”。
让AR服务于所有人
从二手车到航空,从安防做到建筑,不断发掘AR与AI结合的更多可能性,让亮亮视野看到了AR切入B端的潜在价值。通过基于“渲染的显示技术+感知技术+基于场景的AR知识图谱”的三步走战略,亮亮视野也逐渐建立了在AR领域的行业壁垒。
蓝驰创投执行董事曹巍表示,亮亮视野在嵌入式人工智能算法和光学底层技术研发方面的成果,帮助公司建立起了更长期的综合技术壁垒。在光波导显示和嵌入式人工智能算法方面,亮亮视野都已实现关键突破,并成为全球范围内在该领域落地应用的样板。在业务拓展方面,工业场景已经进入到规模化放量阶段,安防场景实战效果显著,民航市场也已经开始加速拓展。
但对于成立7年的亮亮视野而言,AR比赛的上半场依然没有结束。
大洋彼岸,微软和谷歌开始转换思路进入工业、医疗、安防等领域。微软不仅与福特达成合作,让工作人员可以借助HoloLens将整车变成3D可视化的全尺寸模型,还在今年4月1日拿下美国军方的AR设备订单,将为其提供超过超12万台HoloLens,总价值最高可达218.8亿美元。谷歌则在雪藏项目两年之后推出Glass Enterprise Edition,这正是企业版谷歌眼镜,合作方不乏DHL、三星和大众汽车这样的大型公司。
另一边,天风证券郭明錤也曾在3月发布预测报告称,苹果或将在2022年中期推出AR/MR头戴装置。该装置不仅拥有高清晰度显示屏,还将配备眼球追踪系统,能够实时运算AR/MR所需影像/图像/信息。就在4月5日,苹果CEO蒂姆·库克接受《纽约时报》采访时也提到,AR对苹果的未来而言是极其重要的一环,在库克看来,“无论是健康,教育,游戏,零售,已经能看到AR开始在其中一些领域起势。”
行业巨头加入战场,产业链正在逐步走向成熟,但对AR基础领域的研究却更加必不可缺,一是产业链的成熟将带动成本降低,从而促进商业化落地,而对中国AR产业来说,卡脖子问题不能重蹈芯片的覆辙。
中国在AR/VR领域的推动力度在不断加大。2020年11月9日,《国务院办公厅关于推进对外贸易创新发展的实施意见》指出,利用新技术新渠道开拓国际市场,充分运用第五代移动通信(5G)、虚拟现实(VR)、增强现实(AR)、大数据等现代信息技术,支持企业利用线上展会、电商平台等渠道开展线上推介、在线洽谈和线上签约等。在吴斐看来,亮亮视野做的事情和中国数字化进程是同向的:
“航空公司用AR去做检修,其实就是通过数字化转型去带动AI人才和工业整体的提升,这是国家愿意在新基建上面投入巨大的资源,同时让工业GDP的22.5%用于数字化转型的投入。一头拉一头推,这才是我认为未来十年科技企业大红利的点。AR真的能发挥作用,因为新基建本质上是信息化到智能化的过渡,数字化转型就是企业的产品业务都以数字展开,所有跟“人”相关的结合必须有新的手段。”
面对数据和人如何协同升级的难题,二手车、民航等领域找到了AR这样的解决之道,但依然有许多企业亟需进行升级,这需要更多亮亮视野这样的公司共同探索。
根据IDC预估,2021年全球将售出不到100万台AR眼镜和头戴设备,但到2025年,预计销量将增长到2340万台,这其中企业客户将占总销量的85%左右。广发证券研究团队此前也提到,5G时代到来有望大幅度改善硬件之间的协作,从而进入硬件的泛智能化时代,以AR为代表的新型硬件有望获得快速成长。
从田野观察中找价值点,到灯塔模式逐步扎深,再回到战略层面的认知——吴斐认为,AR最重要的是连接了人和数据,让知识得以更快速在虚拟与现实之间流动。AR技术看似技术为人服务,但最终人也在产生新的数据和价值:
“我们早期是在为客户把最佳实践变成知识,把人的知识变成数据,把知识链和知识图谱给到一线,这反过来其实就是知识图谱通过数据再次升级的一个过程——从数据到人,人又回到数据,最后变成知识。”
5G技术的“效率驱动”效应同样不容忽视。国家信息中心信息化和产业发展部主任单志广提到“5G技术的大带宽、低时延、广连接、高可靠等特点,不仅加快了网络速度,也将终端全部纳入网络,实现“万物皆可联”的状态,对传统应用带来深刻的效率变革。”
而在曹巍看来,这对包括AR/VR在内的诸多应用落地起到了重要作用,“5G高带宽,低延迟以及工业分片这三个核心特性让AR有了更大价值。很多过去需要前端运算的事情,现在可以不用在终端上运算,这就减轻了终端的计算压力,也减轻了终端的能耗,从这个角度来讲,5G和AR的结合能在工业、安防、建筑方面能显著降低成本,因为不再依赖昂贵的CPU去做边缘计算,而工业分片可以让5G在区域内高速推送运算结果,基于4K甚至更高清的视频共享和调度就有了保证。此外,基于云端的应用、云端协同等体验也会显著提升。”
在吴斐看来,如今AR行业再次受到关注,在于它打通了人与数据连接的“最后一厘米”,这将是下一个数字化变革的关键。
当风口再来,虚拟和现实世界正在不断交融。