中国AR行业应用专题研究报告2016;AR的基本原理科普
显示世界 · 2017-03-21
突破屏幕、虚实融合、自然交互是增强现实技术最重要的特征。
核心技术突破,政策利好,行业应用广泛和交互方式的变革推动增强现实技术快速发展。
技术驱动的特点决定增强现实行业将经历较长的技术红利期。
顺势而为,结合自身优势,找准合适的技术应用场景,提供增量价值,是创业者切入增强现实市场的关键。
1、虚实融合是AR技术最重要的特征
➀将虚拟场景投射于现实是增强现实的主要特征
增强现实(AR)技术:借助计算机视觉技术和人工智能技术产生物理世界中不存在的虚拟对象, 并将虚拟对象准确“放置”在现实世界中。通过更自然的交互,呈现给用户一个感知效果更丰富的新环境。
在现实世界中精准叠加虚拟信息,实现虚实融合是增强现实最重要也是区别于虚拟现实的关键特征。
➁计算机视觉、虚实融合、人机交互,显示输出是增强现实技术的基础
增强现实的技术原理是:通过摄像机采集真实世界图像,人可以通过语音和手势等对设备输入指令,计算机利用计算机视觉技术和人工智能技术实现对周围环境的理解,同时对交互进行识别。再经过渲染引擎处理,最后通过显示技术输出,以达到虚实融合的效果。
➂更自然的人机交互依赖于人工智能技术的成熟
Analysys易观分析认为,增强现实的核心在于人机交互,而作为其底层的人工智能技术则起着重要作用。增强现实(AR)可以认为是人工智能(AI)的一个可视化呈现和交互方式。
➃以智能眼镜为代表的近眼屏或许是未来增强现实(AR)硬件的方向
AR硬件有两个环节值得关注。
车用平视显示器(HUD):与无人驾驶技术,以及基于LBS地理信息定位的AR服务结合。
AR智能眼镜:基于第一视角的交互更自然。
目前市面上主流的增强现实产品分为三类。分别是头戴显示器,手持移动终端和以PC、HUD车用平视显示器为代表的空间显示器。从市场普及度来看,PC显示器和移动终端略高于以AR眼镜为代表的头戴式显示器。但由于AR眼镜突破了屏幕的限制,未来整个物理界面都可能成为AR的交互界面。
Analysys易观分析认为,以AR眼镜为代表的近眼屏也许是未来增强现实硬件的方向。
2、多重因素推动AR技术快速发展
➀多重因素推动增强现实技术快速发展
➁人工智能技术、计算机视觉技术的进步和大数据的累积推动增强现实技术取得突破性进展
增强现实的核心技术是计算机视觉和人工智能。近年来,与此相关的技术取得了突破性进展。一方面,以神经网络为基础的深度学习算法在视觉识别领域的准确率超过95%。另一方面,互联网时代海量数据也为深度学习算法的训练提供了数据基础。
➂“政策红利+市场教育 ”双轮驱动增强现实技术落地
2016年,有两个信号利好增强现实市场。第一,人工智能技术被提升至国家政策层面,这将极大推动增强现实技术落地;第二,一款名为Pokémon GO的AR+LBS游戏火遍全球,加速了增强现实的市场教育。
➃虚实融合的特点促使增强现实技术行业应用前景广阔
由于增强现实(AR)的工具属性更强,因此其在企业级和消费级市场上都有较广阔的应用。
企业市场上,如军事、安防、工业维修等领域,可以使用AR进行远程的专家指导。医疗领域可以佩戴AR智能眼镜进行第一视角的手术直播或者辅助教学等。教育领域里,可以利用AR将二维图像三维化,并在此上面叠加一些信息,能有效解决知识传递的问题。
消费级市场上,有AR+LBS游戏,比如前段时间很火的Pokémon GO。商场可以利用AR进行立体营销,在旅游中,还可以与LBS的地理信息定位结合,达到线上下线信息的融合。未来甚至还可以延伸到社交等领域。
➄增强现实技术将融合线上信息和线下物理操作
增强现实(AR)的本质之一是融合了虚与实两个平行的世界,模糊了线下线上的界限。
互联网时代,线下、线上信息不对称问题日益严重。而AR的出现正好可以打破这种界限,让人们在线下物理操作的同时,线上信息的访问也变得更自然。这在视觉上的直接表现就是虚实融合。
➅增强现实市场规模将达千亿,市场潜力无限
增强现实市场潜力巨大,Digi-captical预测,到2020年,预计AR/VR市场规模达1500 亿美元。而AR将占据最大份额,为 1200 亿美元。到目前为止,主要科技公司在AR/VR方向的投资总额达到20亿美元。
在增强现实的收入来源预测中,硬件将占最大份额。这说明,早期的AR市场还处于一个技术驱动的阶段,并且会经历一段较长时间的技术红利期。
➆更自然的人机交互需求推动增强现实行业发展
从计算机发展历程看,每一次人机交互的变革都带来巨大的产业革命。从早期鼠标加键盘的PC互联网时代,到触屏实现交互的移动互联网时代,再到未来的人工智能时代,一个总的趋势是:从有屏到无屏再到万物皆屏,从可触摸到无触摸。交互趋于自然流畅,人机交互变得更像人人交互。
这就对下一代个人计算平台提出了要求:第一,突破屏幕。交互应该在整个物理世界中进行。第二, 虚实结合。尤其在移动状态下,生活在物理空间的人们需要有更便捷的实时线上信息。第三,自然交互。语音、手势、图像都可以成为未来交互的入口。而这三个需求,最后都指向了增强现实。
3、我国AR市场发展正处于热启动期
➀底层平台和技术、硬件、内容,以及行业应用构成增强现实产业链的主体
当前的增强现实产业链具有技术驱动型特点,人工智能技术和计算机视觉等核心底层技术制约产业发展。但是,以需求为起点的行业应用却是一个能将技术、硬件和内容结合起来的的商业闭环,是未来发力的重点。
➁巨头基于自身业务生态,以实验室或并购的方式抢先布局底层技术
➂初创厂商重点发力以智能眼镜为代表的硬件环节
➃增强现实市场发展正处于热启动期
增强现实(AR)技术在经历了实验室的探索之后,开始走向产业。最有代表性的例子是2013年原计划谷歌眼镜的发布,将AR的市场教育推向一个高潮。但随后,2015年,谷歌宣布暂停“探索者”项目,AR市场暂时进入低谷期。
Analysys易观分析认为,AR市场目前还处在技术驱动的阶段,并且会经历一段较长时间的技术红利期。未来1-3年内,将有更多厂商进入AR市场,随着底层技术的成熟,硬件设备的完善,AR技术将应用到更多场景中,行业应用解决方案日益丰富。当AR整体产业链能够搭建一个软硬结合、汇集大量优质内容的平台的时候,将会迎来AR真正的爆发期。
➄增强现实技术的商业化还面临着一些阻碍因素
4合适的时点和环节是切入AR市场的关键
➀切入市场的时间点取决于对商业机会的把握
找准行业中的变与不变,把握先机,顺势而为是切入增强现实市场的关键。过去30年,人类分别经历了以IBM和微软为代表的PC时代,以谷歌、BAT等为代表的互联网时代,以苹果、微信为代表的移动互联时代。这其中,变的是技术,是市场热点。而不变的是大的趋势,是娱乐、消费升级背后,人们对工具变革,更自然交互的需求。而未来满足这一需求的很可能是下一代个人计算平台—增强现实。
➁对初创厂商而言:
明确自身定位,找准行业需求是切入增强现实市场的关键
Analysys易观分析认为,在找准需求的过程中,需要注意以下问题。
第一,明确自身定位。遵循行业本身的业务逻辑,提供行业增量价值,以合作者而非颠覆者的身份进入行业。
第二, 找准真正的刚需。技术的推广要结合真正的场景,通过小范围试错,针对用户的反馈进行产品快速迭代。深耕一点,不盲目追求大而全。
第三,找到跨行业共性的机会。通过技术的累积下沉,找到一种平台化的,可以以一个较低成本快速复制的商业模式。同时,善于利用产业内渠道资源。借助上下游资源,利用现有渠道实现产品推广和落地部署。
➂对希望切入企业级市场的初创厂商而言
遵循行业逻辑,提供增量价值,解决“安全—增产—增效” 或许是一条可行之路。
典型企业——亮亮视野:以被集成角色融入传统行业,提供增量价值
亮亮视野:AR眼镜+行业解决方案,切入企业级市场,寻求平台化商业模式
通过智能眼镜与行业解决方案相结合的方式,亮亮视野切入了电力巡检、移动安防、和手术直播领域。试图走出一条“以需求为起点,软硬结合,能快速完成技术下沉和平台化复制的”商业化之路。
➃对希望切入消费级市场的初创厂商而言
可找准标杆企业或平台型企业的战略方向和时机,借助大厂对市场的教育,选择合适时间点切入;针对产品特点,找准细分人群和场景;结合自身产品路线图,规划项目周期,完成产品迭代。
奥图科技:以C端用户为突破口,推进酷镜商业化进程
奥图科技是一个典型的以消费级市场为突破口的增强现实企业。目前选择从户外直播切入,希望实现细分市场和场景的突破。
奥图科技的策略称为“螺旋式” 三步走。
第一步,满足产品的基本功能,如拍照、通信、导航等,实现产品落地。一来能延续用户的使用习惯,二来可以实现智能手机到眼镜的平滑过渡。
第二步,在此技术上加入增强现实信息,产品开始走向量产化。
第三步, 通过开放第三方应用平台,深挖用户社交行为数据,不断迭代产品,实现交互方式的创新。
➄B2B2C也许是第三条可选择的道路
从企业用户切入,通过让B类用户直接付费,保证现金流的持续性;同时完成技术下沉和C类用户的数据积累,不断进行技术和产品迭代。
典型企业——亮风台:依托算法、技术优势,构筑增强现实底层平台
亮风台是一家技术驱动,市场牵引型的公司。采取的是软硬结合、构筑平台的模式,夯实增强现实底层技术。
亮风台:软硬结合+构筑平台,以AR智能眼镜为载体,切入娱乐、教育等领域
亮风台的特点是先从增强现实(AR)的核心软件开发工具HiAR SDK切入,将AR SDK嵌入到操作系统中;在此基础上搭载AR内容平台和前端浏览器。同时以智能眼镜为核心,扩展娱乐、教育、旅游、营销等方面的行业应用。
来源:Analysys易观
AR,即增强现实技术,它的出现意味着能将计算机技术带到现实当中来,能使科技更“贴近”人们的现实世界的生活,被誉为可能是代替智能手机的,未来的下一个平台。
作为永远要离未来更近一些的设计师,当然需要了解时下最新的技术和热点,于是和周围小伙伴们展开了将AR作为课题的系列研究,作为技术储备。和大家分享下AR的基本定义和工作原理部分。
一、AR的基本定义
AR是对现实的增强,是虚拟影像和现实影像的融合。
AR技术具有虚拟现实融合、实时交互、三维注册三大特征。其中三维注册是其中最重要的特征。
三维注册(也叫三维配准)强调计算机生成物和现实环境的对应关系,虚拟的物体和现实环境的三维位置和大小必须完美融合。
观察科技演进的历史会发现从一开始的工业革命,到现在的信息技术革命以及正在蓬勃发展必定会兴起的认知革命,科技的发展其实意味着现实和虚拟的更好融合。而AR正是这种融合时代的代表性技术。
AR/VR技术的起源,可追溯到Morton Heilig在上个世纪五、六十年代所发明的Sensorama Stimulator。他是一名哲学家、电影制作人和发明家。他利用在电影上的拍摄经验设计出了图中这个叫Sensorama Stimulator的机器。Sensorama Stimulator可使用图像、声音、香味和震动,让用户感受在纽约布鲁克林街道上骑着摩托车风驰电掣的场景。这个发明在当时非常超前。
以此为契机,AR也展开了它的发展史。来看看各时期AR的发展里程碑吧。
很多人对于VR、AR、MR等概念还是处于混淆的状态,那么到底如何区别这三者呢?
AR和VR的区别,除了从硬件和技术等方面有区别,归根到底是要看到底是对现实的增强还是完全的虚拟化。
如若是让人们完全投入进入虚拟世界的沉浸感,则是VR。(如超级学校霸王电影里面2人进入街机里面玩超级玛丽)
如若是让虚拟的事物和现实接轨,则是AR。(如超级学校霸王电影里面虚拟世界的英雄形象进入真实世界惩罚坏人)
而MR则是让2者完全的融合,“实时的”进行虚拟和真实的交互。是最终的发展形态。混合现实是实现虚拟和现实的完美融合。
目前的MR和AR可以从设备上来进行区分,有以下2点不同。
比如如果虚拟物体的位置能够随设备而移动,做到随身随行,则是MR的实现,如果不能移动,定位在三维世界中,你离开了,虚拟物体还是摆放在刚刚的位置,则是AR。而MR的最高形态,虚拟和现实已经融为一体,有一致的体验,不容易被区分了。
二、AR的工作原理
在介绍AR的工作原理之前,我们先通过一个例子,让大家有一个简单的认识。
在2009年2月的TED大会上,帕蒂•梅斯(Pattie Maes)和普拉纳夫•米斯特莱(Pranav Mistry)展示了他们研发的AR系统。该系统属于麻省理工学院媒体实验室流体界面小组的研究成果之,他们称之为SixthSense(第六感)。它依靠众多AR系统中常见的一些基本元件来工作:摄像头、小型投影仪、智能手机和镜子。
上图是一个典型的AR系统结构,由虚拟场景生成单元以及显示器和头盔等交互设备构成。其中虚拟场景生成单元负责虚拟场景的建模、管理、绘制和其它外设的管理;显示器负责显示虚拟和现实融合后的信号;头部跟踪设备跟踪用户视线变化;交互设备用于实现感官信号及环境控制操作信号的输入输出。
首先摄像头和传感器采集真实场景的视频或者图像,传入后台的处理单元对其进行分析和重构,并结合头部跟踪设备的数据来分析虚拟场景和真实场景的相对位置,实现坐标系的对齐并进行虚拟场景的融合计算;交互设备采集外部控制信号,实现对虚实结合场景的交互操作。系统融合后的信息会实时地显示在显示器中,展现在人的视野中。
为了保持现实和虚拟的对准,跟踪和识别的技术就显得尤为重要。
检测和识别技术包含图像匹配和识别以及语义检测和识别这2点。
跟踪定位技术则分为基于硬件的定位技术和基于视觉的定位技术2点。
其中基于视觉的跟踪定位技术最核心的技术,也是主流技术。
基于视觉的三维配准包含了这3个发展阶段。
1
二维图片定位
二维图片定位是指基于平面物体的识别和定位,比如现在市场上很常见的一些AR技术图书,又或则是APP应用。这种技术是将现实世界的一张图片作为定位的锚点,计算机生成的虚拟物体会围绕这个定位点,融入现实环境中。
目前基于图片定位的AR是最为成熟的技术,广泛运用在各个地方。目前用在儿童教育图书方面,会比较多。
比如下面的科学跑出来系列图书
2
三维物体定位
二维图片的自然扩展当属三维物体。一些简单的规则三维物体,比如圆柱状可乐罐,同样可以作为虚实结合的载体。对于一些特定的非规则物体,比如人脸,由于有多年的研究积累和海量的数据支持,已经有很多算法可以进行实时精准对齐。比如faceU应用(被人脸识别后,吐彩虹的川普)
3
基于SLAM的三维环境定位
对于三维环境的动态的实时的理解是当前AR在技术研究方面最活跃的问题。其核心就是最近火热的“即时定位与地图构建”(SLAM,SimultaneouslyLocalization And Mapping),在无人车,无人机和机器人等领域也起着核心作用。AR中的SLAM比其他领域中一般难度要大很多,主要是因为AR赖以依存的移动端的计算能力和资源比起其他领域来说要弱很多。目前在AR中还是以视觉SLAM为主,其他传感器为辅的局面,尽管这个情况正在改变。
标准的视觉SLAM问题可以这么描述为:把你空投到一个陌生的环境中,你要解决“我在哪”的问题。这里的“我”基本上等同于相机或者眼睛(因为单目,即单相机,请把自己想象成独眼龙),“在”就是要定位(就是localization),“哪”需要一张本来不存在的需要你来构建的地图(就是mapping)。你带着一只眼睛一边走,一边对周边环境进行理解(建图),一边确定在所建地图中的位置(定位),这就是SLAM了。换句话说,在走的过程中,一方面把所见到(相机拍到)的地方连起来成地图,另一方面把走的轨迹在地图上找到。
目前AR的应用最为前沿的就是微软的Hololens头戴设备了。Hololens的部分应用就使用了SLAM技术。
作者:杜珣 ,Gad-腾讯游戏开发者平台
参考文章:
VR次元 《全球首份AR报告》
艾瑞《2015年中国VR-AR市场研究报告》
易观《中国增强现实市场专题研究报告2016》
易观《中国AR行业应用专题研究报告2016》
凌海滨 《想靠AR超越现实,需要趟过多少坑》
VR看天下 《VR、AR、MR、CR到底如何区分?》
VR/AR背后的弄潮儿:微分几何之逼近理论
VR、AR、MR,看完这篇文章,我再也不混乱了