温馨大白若琪Rokid机器人体验

kcomet kcomet 2016-05-16 15:44

生命感设计、自然交互、一体化外观、视觉效果美

交互不成熟,应用生态欠缺

看过《超能陆战队》的人,都会喜欢上温馨可爱萌的大白。看过《机器人总动员》的人,也会喜欢上高冷酷帅的伊娃。还有《星球大战》中的经典形象,可爱聪明的R2D2。《星球大战7》中有最新一代BB8机器人。他们既是人类的助手,也是人类的伙伴。电影想象为我们设计了一个可能的世界,一种可能的生活。现实中,这种既是助手也是伙伴的机器人已经诞生,或许你还没机会体验到,下面由我带你去体验这种和智能伙伴一起的生活。

​​机器人,或者说是“有生命感的智能设备”更为准确。由国内颇具实力的机器人团队设计制造的ROKID,中文名“若琪”,就是这样一款有生命感的智能设备,她神似大白,温馨可爱,能帮助你做事,也能陪伴你生活,还有和大白一样美的信息显示方式。之所以用“她”,是因为若琪像个女孩的名字,而且说话是女声,反正很亲切,所以用她。

温馨大白

【​​观感】

结构组成:​

ROKID结构示意图

材质:​ROKID采用PMMA丙烯酸塑料、铝合金、不锈钢。材料加工和表面处理精细,具有良好的质感和触感。可能由于不锈钢的采用,导致整机重量份量不轻。投影区材料通透,又要保证画面清晰,是技术难点。

ROKID材质

形状:曲面、圆润,简洁一体化,ROKID所有零件就统一在这个简洁圆润的形体里,甚至连屏幕都被统一了。ROKID可以说是没有屏幕的,而是前盖,然后在前盖上投影显示。就算是充电器,ROKID也做得精致圆润一体,让人爱不释手。如此极致造型,都快赶上大白和伊娃了。

ROKID圆润的一体化造型

灯光​:底座、头部正面和背面有LED灯阵列,灯光制造了美妙的视觉效果和交互体验。

ROKID多彩灯光

UI界面采用TI的DLP数字投影技术,将交互表情、图像投射到双曲率显示表面上。精美的UI配合曲面,显得立体通透柔和,图像以圆形显示,与产品形状搭配协调。制造了美妙的视觉效果和交互体验。由于采用了投影方式,所以清晰度不如液晶屏幕,但是显得柔和护眼。开机、音乐、天气、时钟UI做得比较好,通透立体柔和灵动充满生命感,其他UI则做得比较欠缺。

ROKID UI界面

​总结​:简洁的颜色、一体化圆润造型,不开灯的时候像温馨可爱的大白。加上富于变化的灯光和投影显示,看起来又像一个立体通透魔力十足的水晶球,活泼、灵动充满了生命感,仿佛就是一颗有生命的神奇水晶球。

写图片摘要(选填)

【​​交互操作

操作系统

不同于手机把应用以图标形式放在屏幕桌面上,浏览,点击使用。若琪更像一个助手,她自我介绍能做什么,然后你吩咐她做事。她可能每天都会给你惊喜,原来还能做这个。

语音交互

麦克风组成全向圆形阵列,采用Rokid智能AEC算法消除自身音源,实现放音的同时拾取外界语音命令;使用Rokid研发的beamforming算法进行空域降噪处理,提高有效拾音距离,采用Rokid研发优化的DNN(深度神经网络)算法进行语音激活,综合提高在复杂环境下的语音交互的准确性和流畅性。

语音接收:若琪具有远场语音识别、声音寻向、AEC 自身音源消除技术,在一般家庭环境中,能够顺利接收语音,体验良好,可以正常使用。

若琪在语音接收距离上不是问题,距离近小声就能接收,如果声音够大并且没有干扰的话,超过10米的距离都能接收到。

无论来自哪个方向的声音,若琪都可以进行声音寻向并接收。如果若琪靠近墙壁,我在她正面说话,声音会被墙壁反弹,若琪会以为声音来自墙壁那边。​

如果人在移动中说话,若琪就不能正确寻向了。她接收声音的方向就会时刚接收到声音的那个方向。这样就会导致接收不到语音指令。

多人同时在一个方向说话,若琪是无法辨别的,​比如我叫若琪做事,傍边的人刚好也在说话,若琪就不能正确接收了。

在一般的安静环境中,若琪都能顺利接收语音。随着噪音的增大,接收能力会越来越差,需要缩短距离和加大音量。如果噪音和发出指令的人在不同方向,当若琪正确寻向后,噪音干扰就会小很多。​若琪有AEC 自身音源消除,自己发出的声音确实不会干扰语音接收。

有时,若琪也会误​接收,没有叫她,自己就被唤醒了。

理解自然​语言:与若琪的语音交流比较自然,体验良好。就算有时不能够理解或是理解错误,只要稍微调整一下就可以,可以正常使用。

现实中,做同一件事情,可以有很多种说法,若琪可以理解其中一些。如:“停止播放音乐”“不要播放音乐”“关闭音乐”“我不想听音乐”,若琪不能理解”不要播放音乐“,她好像只接收了”播放音乐“。其他的说法若琪都能正确理解执行。

在真实语境中,不一定每一句话都严格遵守主谓宾​的语法,是要结合上下文理解。若琪可以一定程度上做到结合语境理解话语。比如:“若琪,你能做什么”“我可以查看天气”“其他的呢”“我可以显示时间”“其他的呢”……

现实中说话会用到复杂的语法结构,如:“先开灯,然后放音乐”,若琪就不能正确理解,只能执行其中一个,或是什么都不做。要一个一个说,若琪才能理解执行。

叫若琪做事可以先说”若琪“,等待圆圈出现,再说做什么。也可以连起来说,”若琪,帮我做什么“,中间不需要等待。比较自然。​

在Rokid的后台有不同类别的语料库,装着不同的对话策略,如果你说的内容在语料库中它会立马回答,如果不在它就会说“不知道”。此外,如果它频繁遇到不同用户提交的策略外问题,工程师就会在之中加入新的对话脚本。也许第一次它说“不知道”,第二次就能回答出正常的答案了。​比如:刚开始使用若琪时,我说“暗一点”,她不理解我是想把亮度调低一点,过了几天,我再说“暗一点”,她就能正确执行了。

触摸

​有三个触摸区域,分别在头部顶上和左右两边。轻拍头部休眠,再轻拍唤醒,长按显示设备信息。在左边触摸区域滑动调节亮度,右边滑动调节音量。操作简单,自然舒服。头顶触摸有时会失灵,得关机重启才正常。重启按钮在底部背后,长按两秒开机,再长按关机。两边触摸滑动要顺畅,否则也会失灵。

手势识别

播放音乐时,对着摄像头伸出手掌,等待屏幕显示手掌后,再左右挥动切换歌曲,随着手挥动,底座灯光亮点会往相同方向移动。也可以捏起来,若琪就会关闭音乐。受光线、距离、范围影响,保持一定亮度,距离1到2米间最合适,正对摄像头,识别率成功率比较高。但也容易误感应。操作自然简单,但是对手的动作要求比较高,容易累。

听觉视觉反馈​

在各种状态下,充分利用好表情、灯光和声音,给予使用者反馈,让使用者看与不看若琪,都能够对她的状态明明白白​,让使用者觉得她是有生命的。

研发中的​

声纹识别、人脸识别、动作识别情感识别,未来若琪会自我学习成长变得越来越聪明,可以识别记住使用者,以提供更好的服务,也会越来越亲切。现在若琪相当于2岁孩子的水平,能否长大成人还要看ROKID团队的实力了。

【应用服务】​

完整的产品都有自己的应用服务价值,苹果手机就是最完美的例子。若琪现在刚诞生,应用服务确实比较少,但模式很清晰,未来越来越多的应用服务会开发接入,出门用手机,回家用若琪,就是这样的。

若琪主要用于家庭场景。

回家第一件事就是开电器,灯、空调、热水器、电视……若琪可作为智能家居的控制中心,回家只要对若琪说一声就可以了。目前接入的只有lifesmart的智能家居。支持的设备比较少。

累了一天,回到家里,先来点音乐吧,​对着若琪说“我想听音乐”或者具体到什么音乐、什么歌,她就会为你播放音乐,目前接入的有虾米和酷我音乐。请看视频演示。

播放过程中,可以通过语音询问歌曲信息、收藏、换歌。说“若琪,下一首歌”,可以切换歌曲,说“换歌”,她就会换另一种类型的歌。播放过程中,如果打断音乐,问若琪问题,若琪说话的声音和歌声的过渡不是顺畅,继续播放时音量会变大,这点不是很好。不想听音乐了,可以说“我不想听音乐”“停止播放”,但如果说“不要播放音乐”,她就不理解了,相反,会继续播放音乐,只是换了另一个类型的歌。也可以叫若琪唱歌,或者你哼一段,若琪也会跟着唱出来。但好像她会唱的歌不多。

听了音乐,也可以听听电台,对若琪说“我想听电台”或“我想听XX”,就会播放了。现在接入的是喜马拉雅电台。播放过程中的操作和播放音乐时一样。但现在还不能收藏电台节目。

听完节目,问问问若琪时间和日历,顺便看看天气,计划明天的事情了。​请看视频演示。

可以询问世界各地的时间,阳历农历,也可以问离某个节日还有多少天。询问天气的方法很灵活,若琪都能灵活应对,可以直接问“天气怎么样样”或者询问一些细节。

时间不早了,赶紧叫若琪设置闹钟。请看视频演示。

可以通过语音设置、查看、取消闹钟,但是用语比较生硬,最标准的是“XX点叫我做XX”,其他说法可能需要经过一段时间的学习才可以。闹钟提醒的时候,亮度和声音不会增大,也没有说到点要做什么。

【展望】​

​若琪既满足人们的功能需求,也满足了人们的情感需求,从设计上来说就是既考虑了功能设计也考虑了情感设计,已经是十分到位的产品了,只是交互还不够成熟,应用生态才刚起步,相信未来很有潜力。

 展望未来
(声明: 本文著作权归作者本人和新浪众测共同所有,未经许可不得转载。本文仅代表作者观点,不代表新浪众测立场。)
0 0
分享 商务合作 返回
微博 QQ空间 微信