[发明专利]方言发音词典的构建方法、装置、设备及可读存储介质在审

申请号：	201911098899.4	申请日：	2019-11-11
公开（公告）号：	CN110827803A	公开（公告）日：	2020-02-21
发明（设计）人：	陈昊亮;许敏强;杨世清	申请（专利权）人：	广州国音智能科技有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/02
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	晏波
地址：	510000 广东省广州市黄埔***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	方言发音词典构建方法装置设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种方言发音词典的构建方法、装置、设备和可读存储介质，该方言发音词典的构建方法包括将词汇的多种方言发音数据输入到语音识别装置中；接收语音识别装置基于多种方言发音数据输出的候选音素序列组；从候选音素序列组中选择正确音素序列；根据词汇与正确音素序列，构建方言发音词典。对于方言发音词典中可以添加的词汇，获取多种方言发音数据输入到语音识别装置中，得到候选音素序列组，从中选择正确音素序列与词汇建立映射关系，得到方言发音词典，输入多种方言发音数据，得到的候选音素序列组中结果更加多样，从候选音素序列组中选择正确音素序列保证结果更加正确，提高最终构建的方言发音词典的识别结果的准确性。

技术领域

本发明涉及语音识别领域，尤其涉及一种方言发音词典的构建方法、装置、设备及可读介质。

背景技术

发音词典是语音识别模型中重要的组成部分，通过方言词典可以将接收到的语音信息转化成可处理的音素信息。

在构建发音词典的过程中，普通话发音相对比较统一，识别准确率较高，方言发音间则存在较大差异，不同种类的方言间的发音差异大，即使同一方言种类中不同人的方言发音也存在不小差异，因此发音词典对于方言的识别准确率较低。

发明内容

本申请的主要目的在于提供一种方言发音词典的构建方法、装置、设备及可读存储介质，旨在解决方言发音词典的识别结果准确率较低的问题。

为实现上述目的，本申请提供的一种方言发音词典的构建方法，所述方言发音词典的构建方法包括以下步骤：

将词汇的多种方言发音数据输入到语音识别装置中；

接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组；

从所述候选音素序列组中选择正确音素序列；

根据所述词汇与所述正确音素序列，构建方言发音词典。