Rokid全栈语音智能开发套件体验
外观小巧,包装精致,Led灯光效果柔和,语音唤醒较灵敏。
语音识别效果有待提升,与手机app连接不太稳定。
开箱
外壳与开发板
作为一块开发板来说,Rokid的包装相对来说做的是比较好的,记得我拿到树莓派的时候是包装是一个小牛皮纸袋,Rokid的包装和是一个圆柱形金属外盒,里面分为三层,放下了开发板,螺丝,数据线等配件。打开盒子拿到开发板比我想象的要小很多,如果接上Debug板的话接口稍显的有一点挤。
来自官方开发者平台的截图
开发板的核心参数:
开发板核心参数
Rokid文档地址:https://rokid.github.io/rokidos-linux-docs/reference/dev_board/amlogic/usermanual_s905d.html
Amlogic S905D芯片介绍:http://www.amlogic.com/#Products/197/index.html
根据官方的文档描述开发板使用了晶晨的S905D芯片。这是一颗64位的Cortex™-A53芯片,支持H.265和H.264等格式的4K60帧硬件解码,同时支持H.26460帧的硬件编码,可以了解到的是音视频处理是这块芯片的强项,市面上也有很多机顶盒等产品是基于这款芯片打造的,所以这样一款芯片用在智能音箱产品方面是足以胜任的。
另外开发板配置了2GB大小的LPDDR3内存,及16GB大小的e.MMC存储芯片。外围接口及配置开发板有12个Led灯,4个麦克风组成的麦克风阵列,没有自带扬声器,通过3.5mm耳机接口输出音频。通过Debug板的扩展,引出了Micro HDMI视频接口,USB Type-C以及15针的Extern I/O接口,总的来说接口方面是比较丰富了,至少在开发调试用是足够使用了。
Type-C数据线插入开发板并接入5V的电源(开发板未自带电源适配器,此处用了华为的手机充电头,电源的具体标准参数可在官方文档中找到),便会自动开机。开机过程中开发板的Led灯会呈转圈方式以淡蓝色呼吸灯闪烁,开机完成后若未配置网络,则是以淡紫色呼吸灯闪烁。配网过程需要下载Rokid官方的app配合完成,整个过程非常简单。如果配网完成的Rokid开机完成后开发板会说一句:"Hi 我来了。"
ios端app搜索连接开发板界面
Rokid的APP做的很简洁实用,很容易就能上手实用,不过在连接开发板的时候,刚开始在蓝牙列表中并未搜索到设备,我将手机(iPhone 6s |ios 11.2.5)的蓝牙关闭再打开之后很快就正常搜索到设备
了,具体原因还不是很清楚。
开发板未带扬声器,所以需要自己外接扬声器,这里我使用了一个小熊形状的有线音响,不过由于音箱质量问题,显得声音有点小。
开发板与小音箱
得益于4个麦克风组成的阵列,Rokid的语音唤醒效果还是不错的,比Siri要容易唤醒很多,以一个正常说话的声音即可很轻易的唤醒,在检测到唤醒词的时候,Rokid会亮起周围的十二颗LED灯,并且声源对应方向的LED灯光为白色,实际中发现声源方向的检测也是较为准确的。
关于语音识别
与若琪进行了简单的对话(犹豫我当时正在吃晚饭,所以问了一些与食物相关的问题)。
语音识别效果实测
在我拔电放置一整天后,再次接电发现Rokid没有自动连接到网络,重新使用App为Rokid配网后可正常使用,不知道是不是因为Rokid没有内置电池,长时间断电后有信息丢失的情况。
Nodejs编程接口
官方文档中很详细的描述了如何使用Nodejs或者C/C++在基于Linux系统的RokidOS上开发新功能,我收到的开发板是基于安卓系统的,我并没有打算把它刷成Linux版本的系统。所以无法尝试使用Nodejs或C/C++进行程序开发,不过按照官方文档显示的基于Nodejs的API接口是比较简洁明了,很容易理解的。
这一块由于最近时间比较紧张,工作的事情比较多,忙完公司的事情,回家已经很晚了,这块没来得及花精力去实际体验,如果后续有机会的话再与大家分享。
Rokid开发板有两种系统可以选择,一种是基于Linux的RokidOS,另外一种基于Android定制的,基于Linux系统的RokidOS提供了两种编译方式,一种是基于Ubuntu的自己搭建编译环境,另外一种则是提供Docker镜像,可直接上手使用,也可以说是比较方便了。
编译系统
在花了一些时间下载到基于Android系统的源码后进行了编译尝试,但是很快发现缺少一个so库文件,本以为我下载的代码不全,在查看Rokid在Github上的代码库以后发现确实缺少这样一个文件,在Rokid方面的人进行沟通以后对方告知,目前打算暂停对安卓系统的支持与更新,建议我转移到Linux系统进行尝试。
代码库中缺少文件
不过我没有打算就此放弃,我想到开发板系统现在能正常运行,肯定能在系统中找到我想要的这个so库文件,如果后续有时间的话,我会接着尝试以后与大家分享。
总的来说Rokid作为一块开发板来说表现还是不错的,但是任然有很多需要改进的地方,比如在语音识别的正确率方面有很大的提升空间,在开机速度方面还可以提升得更快一些,现在开机一次估计时间要花2分钟左右,还是挺耗时间的。
在资料方面的话官方的文档中虽然给出了硬件的资料链接,但是已经失效了。关于Linux系统方面的资料要比安卓系统资料丰富非常多,安卓系统资料需要自己去文档和论坛中才能找的到。另外就是官方的文档中主要在说的是基于开发板如何去添加一些新的技能等,以及对提供的API的一些说明,比较少提到对底层实现的一些一些细节,当然Rokid并不是一个全开源的平台,按照官方的说法是开放了70% 操作系统和框架代码,所以有些底层细节提到比较少也可以理解,Rokid推出开发板本来的意图应该也算希望大家基于此开发板去开发更多的技能,而不是对底层进行深入的研究。
软件开发方面的话对Linux版本的系统提供的API做了比较详细的说明,基于Linux的RokidOS,可以使用Nodejs与C/C++进行应用开发。在基于安卓的系统上可以使用Java开发应用,官方也提供了对应的SDK及相应的文档,但是内容方面没有像Linux系统那样详细,官方也表示了目前重点是基于Linux的系统所以在基于安卓的系统上有些落后也可以理解。
最后来一张我的开发板全家福Rokid开发板、树莓派、香橙派、arduino uno R3。
开发板全家福