[发明专利]基于用户意图分析的语音识别矫正方法及其系统在审
申请号: | 202111448714.5 | 申请日: | 2021-12-01 |
公开(公告)号: | CN114333788A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 游海涛;吴昊 | 申请(专利权)人: | 厦门万势顺易科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/26;G06F16/35;G06F40/242;G06F40/295 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 余喜娣 |
地址: | 361000 福建省厦门市思*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 意图 分析 语音 识别 矫正 方法 及其 系统 | ||
1.基于用户意图分析的语音识别矫正方法,其特征在于,包括以下方法:
S1、建立客制化字典数据库;
S2、获取用户输入的语音信息,并根据客制化字典数据库转化为文本信息;
S3、根据所述文本信息进行意图分析;
S4、根据意图分析结果使用基于神经网络的BERT+BILSTM+CRF模型进行命名实体识别,并提取实体;
S5、基于拼音及数据库根据提取实体进行错字替换,并输出正确文本信息。
2.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述意图分析包括纯语音信息识别、删除语音信息、编辑语音信息中的一种或多种,其中所述删除语音信息包括:根据不同情景,进行实体提取,指定语句删除。
3.根据权利要求2所述的基于用户意图分析的语音识别矫正方法,其特征在于:当意图分析为编辑语音信息或删除语音信息,则进入命名实体识别和提取;反之,则进行纯语音信息识别。
4.根据权利要求3所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述意图分析采用bert文本分类模型,将句子中的单字word embedding输入bert文本分类模型预测句子的类别,且当softmax层后的三个意图的预测概率中最大值不到88%时,则本句的意图为纯语音信息识别;若在此情况下确实想表达的是编辑语音信息或删除语音信息,则说明文本意图不够明显,需换一种逻辑重新说明。
5.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述命名实体包括必填词槽、非必填词槽,所述必填词槽包括被修正字、线索词组、组成成分中的一种或多种;所述非必填词槽包括组成成分词组、被修正字词组、指定序数词中的一种或多种。
6.根据权利要求5所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述步骤S5中基于拼音及数据库根据提取实体进行错字替换包括:
将提取实体和待处理文本信息转化为拼音,并进行匹配;
根据匹配结果确认正确字索引位置;
索引字正规化,并将文本信息中的索引字替换为正确字。
7.根据权利要求6所述的基于用户意图分析的语音识别矫正方法,其特征在于:在进行匹配前,当不存在修正字词组时,直接匹配得到正确字索引;当存在修正字词组时,先使用修正字词组匹配待选位置索引,再使用被修正字拼音在待索引里匹配位置索引。
8.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述步骤S5中数据库包括新华字典数据库,所述新华字典数据库为复合多元库,包括按中国拼音常用分析结果的词频顺序排列、以及每个字包含其拼音和组成成分,而所述组成成分包含其拼音、通俗讲法和通俗讲法的同义词。
9.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:还包括根据输出的正确文本信息更新客制化字典数据库,所述客制化字典数据库用于存储用户的习惯性词。
10.基于用户意图分析的语音识别矫正系统,其特征在于:使用权利要求1-9任一所述的基于用户意图分析的语音识别矫正方法,其系统包括:
建立模块,用于建立客制化字典数据库;
获取模块,用于获取用户输入的语音信息,并根据客制化字典数据库转化为文本信息;
意图分析模块,用于根据所述文本信息进行意图分析;
命名实体模块,用于根据意图分析结果使用基于神经网络的BERT+BILSTM+CRF模型进行命名实体识别,并提取实体;
替换模块,用于基于拼音及数据库根据提取实体进行错字替换;
其中,所述替换模块包括转化单元、匹配单元,所述转化单元用于将提取实体和原文本信息转化为拼音;所述匹配单元用于将提取实体的拼音与原文本信息的拼音进行匹配,确认正确字索引位置
输出模块,用于输出正确文本信息;
更新模块,用于根据输出的正确文本信息更新客制化数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门万势顺易科技有限公司,未经厦门万势顺易科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111448714.5/1.html,转载请声明来源钻瓜专利网。