一般电子仪器语音控制系统总体架构框图如图所示,它由语音采集、语音前级处理、语音训练、语音识别、语音提示和输出控制等模块组成。
语音采集模块:它主要包括信号调理和信号采集等功能,主要是将声音信号转换为脉冲序列信号,因此主要包括声电转换、信号采集等功能
语音前级处理模块:它的主要功能是滤除干扰信号、提取语音特征矢量,并将提取的语音特征矢量量化成标准语音特征矢量,因此该模块主要包括语音预处理、特征提取、矢量量化等语音信号处理过程。
语音训练模块:它的主要功能是通过多次采集语音信号的矢量特征通过概率统计从而提取*佳语音特征矢量,防止因环境或说话人情绪波动而产生的误差,因此该模块主要包括概率统计、参数评估等处理过程,用隐马尔可夫模型(HMM模型)实现。
语音识别模块:它的主要功能是将重新采集的标准语音特征矢量与语音模板库中的语音模型进行比较,判断当前语音命令功能,因此该模块主要包括矢量比较与参数评估两个过程。
语音提示模块:它的主要功能是根据语音识别的结果提示用户进行相关操作或说明当前完成的功能,因此该模块主要包括调用提示语音资源文件、D/A转换、信号放大等语音处理过程。
输出控制模块:它的主要功能是根据语音识别给出的信号然后输出相应控制信号,从而实现对目标电子仪器的控制,因此该模块主要包括信号驱动、输出控制器和被控对象。
语音模板库的主要功能是存储训练后的*佳标准语音特征矢量。