全屋智能语音控制解决方案相当于在电脑系统上安装一个“耳朵”,使之具有“听觉能力”。全屋智能语音控制解决方案通过对语音信号处理、语音特征处理、模型训练和解码引擎等复杂步骤,机器最终能识别出语音中的内容、说话人、语言等信息。实现语音控制功能,与用户使用习惯高度相关。
全屋智能语音控制解决方案的近场语音识别,需要用户点击启动,而且用户离终端设备比较近,比如手机或其他终端设备,可以直接借助这些终端设备的实现控制功能。
全屋智能语音控制解决方案的远场语音识别,是以麦克风阵列采集到的语音数据为输入数据,通过语音识别算法将语音信号转写成文字的技术。尽管与近场语音识别技术在原理上是相同的,但由于声源与麦克风之间的空间距离增大,在声波传播过程中会发生信号强度衰减和各种噪声干扰,需要特殊的语音数据拾取和预处理技术。由于声学识别的声波信号特征往往会发生变化,所以对于不同的远场语音拾取技术,需要对语音识别引擎进行自定义适配和优化。
全屋智能语音控制解决方案特定的实施过程。
而全屋智能语音控制解决方案主要由两个部分组成:移动终端语音控制软件和嵌入式的便携语音控制器。装上移动终端语音控制软件的终端,在接收本地语音信息后,通过网络(3G、GPRS、WiFi)向云端发送本地语音信息进行识别,再将来自云端的数据解析并与本地设置指令相匹配,从而得到正确的控制指令。
这些指令经服务器和网关转发到相应设备并执行动作指令后,可在任何时间、任何地点对家庭内部设备进行语音控制。全屋智能语音控制解决方案的嵌入式便携语音控制器通过家庭网关与智能家庭无线传感网络相结合,采集到语音信息后,终端进行识别,并将相应的控制指令转发给网关,通过网关和服务器转发相应的控制指令给相应的设备进行动作指令。