您的位置:主页 > 新闻中心 > 行业资讯 >

语音识别技术原理全面解析

行业资讯 / 2022-09-13 23:15

本文摘要:语音辨识是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和解读人类口述的语言。语音辨识技术就是让机器通过辨识和解读过程把语音信号改变为适当的文本或命令的高技术。语音辨识是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有十分紧密的关系。 语音辨识技术于是以逐步沦为计算机信息处置技术中的关键技术,语音技术的应用于早已沦为一个具备竞争性的新兴高技术产业。

爱游戏app官方下载

语音辨识是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和解读人类口述的语言。语音辨识技术就是让机器通过辨识和解读过程把语音信号改变为适当的文本或命令的高技术。语音辨识是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有十分紧密的关系。

语音辨识技术于是以逐步沦为计算机信息处置技术中的关键技术,语音技术的应用于早已沦为一个具备竞争性的新兴高技术产业。  1、语音辨识的基本原理  语音识别系统本质上是一种模式识别系统,还包括特征提取、模式匹配、参照模式库等三个基本单元,它的基本结构如下图右图:  不得而知语音经过话筒转换成电信号后加于识别系统的输出末端,首先经过预处理,再行根据人的语音特点创建语音模型,对输出的语音信号展开分析,并提取所需的特征,在此基础上创建语音辨识所需的模板。而计算机在辨识过程中要根据语音辨识的模型,将计算机中存放在的语音模板与输出的语音信号的特征展开较为,根据一定的搜寻和给定策略,找到一系列拟合的与输出语音给定的模板。然后根据此模板的定义,通过排序就可以得出计算机的辨识结果。

似乎,这种拟合的结果与特征的自由选择、语音模型的优劣、模板否精确都有必要的关系。  2、语音辨识技术的发展历史及现状   1952年,ATTBell实验室的Davis等人研制了第一个可十个英文数字的特定人语音强化系统一Audry系统1956年,美国普林斯顿大学RCA实验室的Olson和Belar等人研制出能10个单音节词的系统,该系统使用带通滤波器组取得的频谱参数作为语音强化特征。1959年,Fry和Denes等人尝试建构音素器来4个元音和9个辅音,并使用频谱分析和模式匹配展开决策。

爱游戏app体育官方下载

这就大大提高了语音辨识的效率和准确度。   从此计算机语音辨识的受到了各国科研人员的推崇并开始转入语音辨识的研究。60年代,苏联的Matin等明确提出了语音完结点的端点检测,使语音辨识水平显著下降;Vintsyuk明确提出了动态编程,这一拒斥在以后的辨识中不可或缺。

   60年代末、70年代初的最重要成果是明确提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决问题了语音信号的特征提取和平均宽语音给定问题;同时明确提出了矢量分析(VQ)和虚马尔可夫模型(HMM)理论。语音辨识技术与语音合成技术融合使人们需要挣脱键盘的束缚,取而代之的是以语音输入这样便于用于的、大自然的、人性化的输出方式,它于是以逐步沦为信息技术中人机接口的关键技术。  3、语音辨识的方法  目前具备代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量分析(VQ)、人工神经网络(ANN)、反对向量机(SVM)等方法。

  动态时间规整算法(DynamicTimeWarping,DTW)是在非特定人语音辨识中一种非常简单有效地的方法,该算法基于动态规划的思想,解决问题了发音长短不一的模板给定问题,是语音辨识技术中经常出现较早于、较常用的一种算法。在应用于DTW算法展开语音辨识时,就是将早已预处理和分帧过的语音测试信号和参照语音模板展开较为以提供他们之间的相近度,按照某种距离测度得出结论两模板间的相近程度并自由选择最佳路径。


本文关键词:爱游戏app官网入口,语音,识别,技术,原理,全面,解析,语音,辨识

本文来源:爱游戏app官方下载-www.sxasn.com