AI人工智慧重要里程碑-“类视觉”篇
在众多未来世界的电影中,最让烫哥有感的莫过于2015年上映,描述未来具备人工智慧的机器人电影——“成人世界”(Chappie),故事内容大致为南非政府为解决约翰尼斯堡居高不下的犯罪率,决定采购机器人来加强治安防护。剧中的机器人Chappie透过出厂时配备的“图像辨识”和“语音分析”解码器,可不断吸收外界资讯,加速深度学习(Deep Learning),自主意识让Chappie可自行决定想做的任何行为;剧中也不例外地探讨了当机器人具备自我学习、意识甚至智慧时,对人类而言是件好事还是坏事,烫哥对于“科技始终来自于人性”这句话深信不疑,机器人就是最好的一项例子。
图注: 描述具备AI智慧的机器人电影-成人世界(Chappie)
视觉是上天赋予人类最好的礼物之一
对于“看的见”这件事,大多数人都已习以为常,烫哥在显示业界打滚多年,显示技术日新月异,没有最新、只有更新,CRT、TFT、电浆电视、OLED、LED、YAG、2K、4K、KSF、量子点,以及最近非常火红的Micro LED话题,都是为了满足终端品牌的荷包,不对,是为了满足消费者对于次世代显示技术的渴望。但你是否曾经有疑问,你透过眼睛看到的图片、影像与其他人或搭载“类视觉”感测器的机器人所看到的画面是相同吗?如果追求极致的“显示行业”是供给,那接收端的“视觉”就是需求,烫哥今天就来跟大家分享,未来AI人工智慧的重要触角—“类视觉”。
图注: AI智能深度学习模仿画家画风的作品
“显示”与“视觉”的配合就像是一场完美的交响乐演奏会,乐器经过音乐家完美的演奏,再传到听众耳朵中,听到自己喜爱的音乐时,大脑便会分泌多巴胺(Dopamine),多巴胺又被称为快乐物质,负责传递快乐和兴奋的功能,而分泌多巴胺的部位为大脑的前额叶,前额叶就是大脑中掌管人类之所以“高等”于其他生物的“复杂性思考能力”与“管理情绪”的最高指挥官。
图注: 人类视觉VS 电子计算机“类视觉”
举例来说,烫哥把听到古典乐会开心这件事拆解成三个阶段,第一阶段是古典乐透过耳朵(感知层)收集,透过神经系统(网路层)传到大脑,经大脑运算后,判定为喜欢的音乐后,随即通知前额叶: OK,你可以开始分泌“快乐”的多巴胺了(应用层),这时你就会出现快乐、开心的情绪,这整个过程可能在一秒的时间内完成,咦,大家对于这三阶段是否有种似曾相识的感觉呢? (可参考烫哥文章“为什么说LED物联网应用已经起飞了?”)
图注: 让烫哥分泌快乐多巴胺的“柏林爱乐乐团”
“类视觉”感测器将帮助AI收集更多讯息
烫哥先坦白,“类视觉”这词在业界还没人使用在IoT物联网、车联网、工业4.0或AI人工智慧等产业,而是烫哥看了许多物联实际应用,加上感测技术大幅进步,AI可以更容易分辨颜色、距离、亮度和3D维度感受,才有感而发自创“类视觉”这词,如果各位业界先进对这词有不同见解,再请多多包涵、指教。烫哥举几个最近看到搭载“类视觉”感测器的智能产品与大家分享,让大家感受一下生活周遭常见的物品,在植入“类视觉”感测器后的差异,以及所带来的额外效益。
图注: 人类视觉VS 电子计算机“类视觉”
具备视觉功能的智能贩卖机
去过日本自助旅行的朋友,对于JR(Japan Railways)日本铁路公司不会感到陌生,烫哥发自内心的佩服日本超高效率的铁道运输系统,全球最繁忙的50个车站中,日本就占了40个以上,日本同时也是全球客运量第一名的国家。举全球最繁忙的新宿站为例,每日进出人次为360万人次,在寸土寸金的日本车站中,贩售饮料的贩卖机体积必须瘦身、减少人员维护次数,JR子公司Acure推出了新一代的智能贩卖机。
Acure智能贩卖机使用人脸识别系统技术,能辨识顾客的性别和年龄,推荐不同饮料,假设顾客是男士,这个机器很可能就会推荐一罐咖啡,因为调查显示男士普遍爱喝咖啡,新一代感测器还可辨别顾客年龄,如果顾客是50岁的男士,推荐的则可能会是绿茶。而如果顾客是20多岁的女性,贩卖机就会推荐她们爱喝的茶饮料或者微甜的饮料;另外,随着季节温度和每日时间的变化,这种机器推荐的饮料也不一样。智能贩卖机的销售量是传统贩卖机的三倍,这一机器的荧幕使用两片46"触摸控制荧幕,平时可拨放广告,距离感测器侦测顾客靠近时,就会进入购买模式,并推荐你合适的饮料,就像一位店员站在你面前问你:Hello~今天想来杯什么饮料吗?
图注: Acure推出新一代“看的见”的智能贩卖机
让你更健康的智能售票机
为了提升民众运动的习惯,俄罗斯奥林匹克委员会在莫斯科西部地铁站,安装了数台可以跟乘客互动的售票机,互动的内容是什么呢?我们都知道体操是俄罗斯的强项,只要你能在2分钟内做完30个深蹲动作,就能得到一张免费车票。为什么是深蹲而不是其他动作呢?深蹲是增长肌肉和燃烧脂肪效率很高的一个“简单”动作,俗话说:深蹲练得好,男/女朋友回家早,大家不要想歪,回家早的原因是因为深蹲可以锻炼四头肌、肌后群和小腿肌肉,让你的体态看起来更好,异性缘自然也会增加,这个看似简单的动作,后半段很多人都做到人仰马翻。
图注: 体操选手Yelena Zamolodchikova示范深蹲动作
自动驾驶汽车的眼球-计算机视觉
Intel以每股63.54美元,总收购金额153亿美元买下共同开发自动驾驶技术的以色列伙伴公司“Mobileye”,成为以色列有史以来金额最高的科技公司收购案,Mobileye在全球ADAS技术与防撞系统市占率超过70%,全球超过90%的车厂都有与Mobileye合作,先前Mobileye也与Intel、BMW合作开发自动驾驶汽车解决方案,下半年将进行自驾车上路测试,这也是Intel收购Mobileye的主要原因。
图注: Mobileye的机器视觉技术
计算机视觉系统主要由“图像撷取”、“图像处理和分析”与“讯号输出”三大部分,需要硬件包含: 光源、摄像头、影像感测器、影像处理芯片、分析软体等硬件,自驾车透过摄像头与雷达建立起机器视觉,收集车外讯息,经由定制化芯片演算分析后,输出执行指令。在自驾车的五个等级分类中,驾驶的手要完全离开方向盘,让汽车自行驾驶,至少要达到Level 4,汽车配备之类视觉系统,就必须精确的识别物体、前后方车辆、两侧车辆、交通标志、车道标线、交通信号收集。
图注: 计算机视觉系统的组成硬件和软件
类视觉帮助物联网发展更迅速
计算机视觉在“感知层”帮助越来越多的装置互联所产生的效益不容小觑,根据GE发布报告显示,假设工业4.0为产业带来1%的效率提升或能源节约成效,量化数据后,来看这小小的1个百分点效益提升,对全球能源就是极大助益,例如全球航空业节约1%的燃料使用,将减少300亿美元支出、铁路系统效率提升1%可减少270亿美元支出、电力发电节约1%的燃料使用,可减少660亿美元支出,其他还有医疗系统和石油天然气探勘与运输等系统。
透过更多的“类视觉”感测器所收集的大数据资料,可加速每个设备、装置或机器的学习样本累积,提升无人系统自主学习领域之宽度与广度,电影中描绘未来世界中的AI人工智慧,对你而言,是否不再那么遥不可及了呢?
*注:本文由行家说APP与作家专栏作者阿烫哥联合出品。谢绝任何未经许可的转载。授权或者加入显示群请联系微信:hangjia199。
· End ·
感谢支持原创的晶元光电对专栏基金的赞助