[发明专利]方言发音词典的构建方法、装置、设备及可读存储介质在审
申请号: | 201911098899.4 | 申请日: | 2019-11-11 |
公开(公告)号: | CN110827803A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 陈昊亮;许敏强;杨世清 | 申请(专利权)人: | 广州国音智能科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方言 发音 词典 构建 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种方言发音词典的构建方法、装置、设备和可读存储介质,该方言发音词典的构建方法包括将词汇的多种方言发音数据输入到语音识别装置中;接收语音识别装置基于多种方言发音数据输出的候选音素序列组;从候选音素序列组中选择正确音素序列;根据词汇与正确音素序列,构建方言发音词典。对于方言发音词典中可以添加的词汇,获取多种方言发音数据输入到语音识别装置中,得到候选音素序列组,从中选择正确音素序列与词汇建立映射关系,得到方言发音词典,输入多种方言发音数据,得到的候选音素序列组中结果更加多样,从候选音素序列组中选择正确音素序列保证结果更加正确,提高最终构建的方言发音词典的识别结果的准确性。
技术领域
本发明涉及语音识别领域,尤其涉及一种方言发音词典的构建方法、装置、设备及可读介质。
背景技术
发音词典是语音识别模型中重要的组成部分,通过方言词典可以将接收到的语音信息转化成可处理的音素信息。
在构建发音词典的过程中,普通话发音相对比较统一,识别准确率较高,方言发音间则存在较大差异,不同种类的方言间的发音差异大,即使同一方言种类中不同人的方言发音也存在不小差异,因此发音词典对于方言的识别准确率较低。
发明内容
本申请的主要目的在于提供一种方言发音词典的构建方法、装置、设备及可读存储介质,旨在解决方言发音词典的识别结果准确率较低的问题。
为实现上述目的,本申请提供的一种方言发音词典的构建方法,所述方言发音词典的构建方法包括以下步骤:
将词汇的多种方言发音数据输入到语音识别装置中;
接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;
从所述候选音素序列组中选择正确音素序列;
根据所述词汇与所述正确音素序列,构建方言发音词典。
可选地,所述将词汇的多种方言发音数据输入到语音识别装置中的步骤之前包括:
将所述词汇对应的普通话发音的标准音素序列添加到所述语音识别装置中。
可选地,所述将词汇的多种方言发音数据输入到语音识别装置中的步骤包括:
将所述词汇的多种方言发音数据输入到所述语音识别装置中;
将所述词汇的每种方言种类中来源相同的方言发音数据多次重复输入到所述语音识别装置中;
将所述词汇的每种方言种类中来源不同的方言发音数据输入到所述语音识别装置中。
可选地,所述接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组的步骤之后包括:
将所述候选音素序列与对应所属的方言种类进行关联标记;
确定同一种类方言发音数据的所述候选音素序列组中各候选音素序列的概率分布。
可选地,所述从所述候选音素序列组中选择正确音素序列的步骤包括:
确定所述概率分布中的最大值;
将所述最大值对应的所述候选音素序列组中的候选音素序列作为正确音素序列。
可选地,所述从所述候选音素序列中选择正确音素序列的步骤之后包括:
比较所述正确音素序列与所述标准音素序列;
若所述正确音素序列与所述标准音素序列不同,则将所述之前音素序列与所述标准音素序列间建立映射。
可选地,所述方言发音词典的构建方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911098899.4/2.html,转载请声明来源钻瓜专利网。