谷歌推出基于AI的开源手势识别算法,可识别单手21个骨骼点

8月20日消息,谷歌发布全新的手势识别技术,该技术集成于开源跨平台框架MediaPipe(可为多种类型的感知数据构建处理流程),特点是采用机器学习技术,支持高准确性手势和五指追踪,可根据一帧图像推断出单手的21个立体节点。与目前市面上较先进的手势识别技术相比,谷歌的全新技术不需要依赖台式机来计算,而是在手机上就能进行实时追踪,并且还能同时追踪多只手,可识别遮挡。

AR,增强现实应用,增强现实软件,增强现实技术的应用,ar技术

据谷歌称,该手势识别技术可形成对基础手语的理解,以及对手势操控的支持,还可用于AR。而为了训练识别手势的机器学习算法,谷歌采用了一个由3个模型组成的框架,包括:手掌识别模型BlazePalm(用于识别手的整体框架和方向)、Landmark模型(识别立体手部节点)、手势识别模型(将识别到的节点分类成一系列手势)。其中BlazePalm可为Landmark模型提供准确建材的手掌图像,这大大降低了对旋转、转化和缩放等数据增强方式的依赖,让算法将更多计算能力用在提高预测准确性上。

AR,增强现实应用,增强现实软件,增强现实技术的应用,ar技术

接下来,我们来一一解释下每个模型的具体细节。

BlazePalm:这是一个可识别单帧图像的模型,主要用于识别手掌初始位置,与用于识别面部的BlazeFace模型相似,都对移动端的实时识别进行了优化。BlazePalm可识别多种不同手掌大小,具备较大的缩放范围(~20倍),还能识别手部遮挡,并且能通过对手臂、躯干或个人特征等的识别来准确定位手部,弥补手部对于高对比度纹理特征的缺失。

在经过训练后,BlazePalm对于手掌识别的准确率可达95.7%。

Landmark模型:这一模型根据回归的方式,在BlazePalm识别到的手掌范围内可识别到21个立体节点坐标,它的识别效果足够好,甚至可以识别部分可见或自我遮挡的手部。

为了训练Landmark模型,谷歌还在真实数据中混合额外的人工合成手掌模型数据。在经过训练后,算法的平均回归误差可降低到13.4%。

手势识别模型:该算法模型可根据关节的的角度识别每根手指的状态,如:弯曲或伸直。接着,它会将每根手指的状态映射到的预定义的手势上,并通过这种方法来预测基础的静态手势。据悉,谷歌现有的预定义手势包括美国、欧洲和中国三个国家的不同数数手势,以及竖大拇指、握拳、OK、“蜘蛛侠”等手势。

目前,谷歌的这款全新手势识别算法将通过MediaPipe框架进行开源,并希望通过这种方法让研究人员和开发者创作出有创意的应用场景和研究途径。而接下来,谷歌将继续提高这项手势识别技术,增加可识别的手势,并将增加对动态手势的识别。

相关推荐

87晚汇 | 东芝推出基于Windows的企业AR眼镜 Uber申请车载VR专利

今天的热点有:东芝推出基于Windows的企业级AR智能眼镜;Varjo与Socionext合作开发世界首款人眼分辨率VR/XR头显;谷歌将在2018年Display Week详细介绍超高分辨率VR显示屏;微软展示三款VR控制器原型等。

87晚汇 | HTC Vive Pro售价6488元 谷歌商店增加“Instant”功能

今天的热点有:HTC Vive官方公布Vive Pro专业版头显售价6488元,4月5日开始发货;Magic Leap基于Linux推出开发者门户和SDK;Oculus为开发者推出硬件报告;《玩家一号》 拍摄制作中使用了Oculus DK2、Vive和HoloLens等。

谷歌车载系统要来了,还有高通加持

据外媒消息,黑莓公司今日宣布推出最新设计,在第三代“骁龙汽车驾驶舱平台”上虚拟化AndroidAutomotiveOS(谷歌车载系统),以帮助汽车制造商在加快产品上市的同时,提供终极驾驶舱体验。基于高通的SoC,未来汽车的数。

87晚汇 | 谷歌或在GDC发布新VR/AR开发工具 Snap计划明年推智能眼镜

今天的热点有:谷歌或将在GDC 2018发布新VR/AR开发工具;报告显示Snap计划2019年推出智能版Spectacles眼镜;OptiTrack将在GDC展示基于位置的《亚利桑那阳光》;2018年新款iPad将配3D感测等。

谷歌推出安卓汽车的重大更新

谷歌助理的驾驶模式也得到了增强,该公司宣布安卓汽车很快将进入本田汽车。安卓汽车自2015年以来一直存在,自其诞生以来,它的功能和美感逐渐增强。根据谷歌周四发表的一篇博客文章,概述了其汽车产品的未来,这一趋。

谷歌推出新的私有计算服务

近日,官方宣布推出一套新的PrivateComputeServices(私有计算服务),可在私有计算核心和云之间架起保护隐私的桥梁。其目的是让数据在你的设备上保持隐私,并以保护隐私的方式利用云。现在,Google已经通过私有计算。

谷歌推出WebXR 开发人员现可用API为Chrome浏览器添加 AR功能

无需使用其他应用程序。

谷歌推出地图API,帮助开发《Pokemon Go》类型AR游戏

据悉,全球200多个国家的超过1亿个景点都可以用于开发数字游乐场。

谷歌推出光场技术实验平台Welcome to Light Fields

Light Fields本质上是一套复杂的算法,可以捕捉、拼接和渲染360度视频或VR动画,从而在VR环境中创造真实感和“存在感”。

谷歌拟推出支付系统 eBay股价下跌近4%

  eBay股价昨日下跌近4%,因为人们猜测,全球最大的搜索引擎公司谷歌即将公布一款新型网络支付系统的测试版,与在线拍卖网站eBay利润颇丰的支付系统PayPal展开竞争。  市场对谷歌推出新型支付系统的预期已有数月之久,此举恰逢该行业剧变,全球一些最大的互联网公司纷纷调整战略,以便更好地与谷歌竞争...

盒子游戏,游戏玩家专属个性阅读社区


©CopyRight 2010- 2020 BOXUU.COM Inc All Rights Reserved

鄂公网安备 35020302000061号- 鄂ICP备2020015574号-1