当前位置: 智家网 > 资讯中心 > 详情

智能语音识别技术在20世纪中的重大进展

行业新闻 | 2017-03-23 15:10:23

语音识别技术与其自然语言处理技术相结合,可以构建出更加复杂的应用。例如与机器翻译、语音合成技术等相结合,可以实现语音到语音的翻译等应用。

在语音识别的研究发展过程中,相关研究人员根据不同语言的发音特点,设计和制作了汉语、英语等各类语言的语音数据库。这些语音数据库可以为国内外有关的科研单位提供汉语连续语音识别算法研究和系统设计,也可以为产业化工作提供充分、科学的训练语音样本。

目前在大词汇语音识别方面处于领先地位的IBM语音研究小组,他们从20世纪70年代开始进行这些研究;同时AT&A的贝尔研究所历经1 0年研究有关非特定人语音识别的实验,确立了如何制作用于非特定人语音识别的标准模板的方法。在这一时期所取得的重大进展有以下几点。

① 隐马尔柯夫模型( HMM)技术的成熟和不断完善成为语音识别的主流方法。从Baum提出相关数学推理,经过Labiner等人研究,到卡内基一梅隆大学的李开复实现第—个基于隐马尔柯夫模型的大词汇量语音识别系统Sphinx,之后的语音识别技术都和HMM技术挂钩。

② 以知识为基础的语音识别的研究越来越受到重视。在连续语音识别时,除了能识别声学信息外,还能利用各种语言知识,诸如构词、语义、句法、对话背景方面的知识进一步对语音作出识别和理解。

③ 人工神经网络在语音识别中的应用研究兴起。人工神经网络大多采用基于反向传播法(BP算法)的多层感知网络,具有区分复杂的分类边界的能力,能够帮助模式划分。由于其有着广泛的应用前景,因此成为了语音识别应用的一个热点。

(1) 机器对语音的识别和理解:要对自然语音进行识别和理解,首先必须将连续的讲话分解为词、音素等单位,然后还要建立一个理解语义的规则。

(2) 对信息量大的语音识别困难:语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如一个说话人在随意说话和认真说话时的语音信息是不同的;且同一个人的说话方式随着时间变化,各地方言之间也不一样,这在客观上对语音识别造成了一定的 阻碍。

(3) 对模糊性的语音识别困难:同音词为语音识别带来困扰,,就好比说话者在讲话时,不同的词可能听起来是相似的。

(4) 语音特性受上下文影响:单个字母或词、字的语音特性受上下文的影响,单词在不同的语境中呈现不同的重音、音调、音量和发音速度,表达的意思也不同,会使语音辨识受到干扰。

(5) 噪声、干扰的影响:环境的噪声和干扰对语音识别也有十分严重的影响,使语音识別率降低。

分享到:

留言咨询,与创业顾问1对1沟通

免费获取定制加盟方案

我已阅读并同意 《智家网服务条款》

* 我们严格保护用户隐私,绝不泄露您的任何信息,请放心填写。

已有254983人成功加盟

用户留言

    留言成功,该公司会尽快与您联系!

    请求中...

    联系人:请求中...

    电    话:请求中...

    地    址:请求中...

    网    址:请求中...

    我知道了

    与加盟管家直接沟通

    0371-55283600

    拨打电话

    索要资料

    *姓名:

    *电话:

    留言:

    加盟咨询 索要
    资料
    在线留言
    留言

    关注“智家头条”公众号

    市场分析 | 营销经验 | 厂家信息

    复制微信号

    免费服务热线:0371-55283600

    官方客服QQ:2248064978 

    谷经理:17329408867(微信同号)

    刘经理:17329403639(微信同号)

    贺经理:18137778751(微信同号)