图片12
近年来,随着人们安全要求的逐步提高和远程视频会议系统的快速发展,基于智能环境生物特征的身份识别技术已成为模式识别领域的研究热点,广泛应用于智能视觉物联网、公共安全、金融服务议系统等领域。
受数据噪声和识别系统本身的限制,基于单一生物特征的身份识别系统的准确性有限。因此,研究人员提出利用视听信息整合身份识别来提高识别的准确性,引起了广泛的关注。但目前基于视听信息融合的身份识别主要局限于理想环境下的单模态识别和现有融合方法上音视频特征的简单融合。
对于复杂环境下单模态生物特征的有效提取,很少考虑高精度、高普遍性识别算法的结构和音视频特征的确定。从人的视听认知机制出发,智能环境生物识别技术从特征提取、识别算法和集成规则三个方面研究了视听信息集成身份识别,为智能环境下的视听信息识别提供了可行的解决方案。
智能环境生物识别技术实现了复杂背景下人脸特征和语音特征的精确高表征提取。智能环境生物识别技术提出了基于识别能力分析的系数提取方法,且在分析头发几何特征和颜色特征的基础上,将人体特征应用于人脸识别,扩展了人脸特征的多样性。鉴于传统语音参数受噪声影响较大,只能反映语音静态特征的缺点,智能环境生物识别技术能有效反映人耳听觉特征的滤波器,并提取了能反映语音动态特征的滑动差分倒谱系数。
目前,基于子空间分析的方法已成为人脸识别的主流算法,因为它具有描述能力强、可分性好、计算简单等优点,经常面临高维样本问题,导致人脸识别系统泛化能力差。智能环境生物识别技术结合子空间分析方法和核思想,提出了相关权重识别分析算法和局部投影算法,一方面解决了高维小样本问题,另一方面解决了传统子空间分析方法在处理高度线性不可分割对象时能力差的缺点。解决说话人识别模型建模问题的模型是当前说话人识别的主流算法,并在此基础上衍生出一系列说话人识别算法。针对训练语料库短导致模型参数训练不足、识别性能下降的问题,智能环境生物识别技术通过引入因子分析技术,实现了自适应平均值模型。演讲者识别系统是基于模型和因素分析技术产生的国内外演讲者识别研究前沿的主流系统。本文通过改进局部投影算法,实现了基于视听信息多层次融合的智能环境下演讲者识别系统中矢量的有效降维。
智能环境生物识别技术的研究内容有效地提高了计算机对复杂感知信息的理解和异构信息的处理能力,进一步扩大了多生物特征集成身份识别的应用条件和范围,有效地提高了基于音视频多特征集成身份识别的鲁棒性和识别率,对促进我国智能环境人工识别技术的发展具有重要意义。