自动语音识别的分类

自动语音识别的分类,第1张

自动语音识别通常有以下几种分类方法:

(1)按系统的用户情况分:特定人和非特定人识别系统;

(2)按系统词汇量分:小词汇量、中词汇量和大词汇量系统;

(3)按语音的输入方式分:孤立词、连接词、连续语音系统等;

(4)按输入语音的发音方式分:朗读式、口语(自然发音)式;

(5)按输入语音的方言背景情况分:普通话、方言背景普通话、方言语音识别系统;

(6)按输入语音的情感状态分;中性语音、情感语音识别系统。

目前的语音技术能力主要包含了四个方面:语音唤醒、语音识别、语音理解和语音合成

语音唤醒

语音唤醒指在待机的状态下,用户说出特定指令(唤醒词)使设备进入工作状态或完成某一操作;当前更多应用于手机、可穿戴设备、车载设备、智能家居等。

1、常见两种唤醒方式:“一呼一答”和“唤醒词+命令词”;即多轮对话(一次唤醒、一个任务、多轮交互)和连续对话(一次唤醒、多个任务,无需唤醒)

2、唤醒词设计原则:易唤醒、低误唤醒 、品牌性、易记易读性

3、华为和苹果手机语言助手唤醒交互:

· 手机的语音助手都是基于特定的人识别,非用户本人无法用同样的唤醒词唤醒手机语音指令,

· 采取的唤醒方式均为“一呼一答”

· 唤醒词设计,华为的“我的荣耀”基于品牌调性,但易读性不强

· 在语音交互过程中,用问答的方式给到用户强反馈,单纯的铃声不足以引起用户触达,通常情况下用户使用语音是在不方便查看手机或者有其他干扰的情况下的。

语音识别

语音识别技术,也被称为 自动语音识别 Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

1、语音识别包括两个阶段 :训练和识别。

训练阶段:收集大量的语音语料,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。

识别阶段:将输入语音的特征矢量参数和参考模型库中的参考模型 进行相似性度量比较,把相似性最高的输入特征矢量作为识别结果输出。

2、语音识别对象:特定人识别(手机语音助手,设定只识别手机用户个人的声音)、非特定人识别(语音搜索,识别搜索词)。

特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。

3、基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:

一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;

第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。

语音理解

语义理解是指机器能够结合上下文,自然地理解用户的需求,并能给出正确以及人性化的反馈。

语音合成

语音合成是通过机械的,电子的方法产生人造语音技术。语音合成的关键点是真人音色模拟,一致性、流畅性、稳定和有情感。

语音合成,又称 文语转换(Text to Speech)技术 ,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、 数字信号处理 、计算机科学等多个学科技术,是 中文信息处理 领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

TTS结构

语言处理

在文语转换系统中起着重要的作用,主要模拟人对自然语言的理解过程——文本规整、词的切分、 语法分析 和 语义分析 ,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。

韵律处理

为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然。

声学处理

根据前两部分处理结果的要求输出语音,即合成语音。

所谓模型锻炼就是指依照一定的原则,从大量已知语音形式中获取一个最具特征的模型参数。而形式匹配则相反,是依据一定原则,将未知语音形式与模型库中的某一个模型取得最佳匹配。

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。

语音识别技术是一种将语音转换为文本的技术。它通常包括两个主要步骤:语音预处理和语音识别。语音预处理步骤包括语音信号的采集、降噪、分帧、特征提取等操作。

语音识别技术,目标是将人类的语音中的词汇内容转换为计算机可读的输入。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/4275265.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-22
下一篇2023-08-22

发表评论

登录后才能评论

评论列表(0条)

    保存