[发明专利]基于用户意图分析的语音识别矫正方法及其系统在审

专利信息
申请号: 202111448714.5 申请日: 2021-12-01
公开(公告)号: CN114333788A 公开(公告)日: 2022-04-12
发明(设计)人: 游海涛;吴昊 申请(专利权)人: 厦门万势顺易科技有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/22;G10L15/26;G06F16/35;G06F40/242;G06F40/295
代理公司: 北京权智天下知识产权代理事务所(普通合伙) 11638 代理人: 余喜娣
地址: 361000 福建省厦门市思*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 用户 意图 分析 语音 识别 矫正 方法 及其 系统
【权利要求书】:

1.基于用户意图分析的语音识别矫正方法,其特征在于,包括以下方法:

S1、建立客制化字典数据库;

S2、获取用户输入的语音信息,并根据客制化字典数据库转化为文本信息;

S3、根据所述文本信息进行意图分析;

S4、根据意图分析结果使用基于神经网络的BERT+BILSTM+CRF模型进行命名实体识别,并提取实体;

S5、基于拼音及数据库根据提取实体进行错字替换,并输出正确文本信息。

2.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述意图分析包括纯语音信息识别、删除语音信息、编辑语音信息中的一种或多种,其中所述删除语音信息包括:根据不同情景,进行实体提取,指定语句删除。

3.根据权利要求2所述的基于用户意图分析的语音识别矫正方法,其特征在于:当意图分析为编辑语音信息或删除语音信息,则进入命名实体识别和提取;反之,则进行纯语音信息识别。

4.根据权利要求3所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述意图分析采用bert文本分类模型,将句子中的单字word embedding输入bert文本分类模型预测句子的类别,且当softmax层后的三个意图的预测概率中最大值不到88%时,则本句的意图为纯语音信息识别;若在此情况下确实想表达的是编辑语音信息或删除语音信息,则说明文本意图不够明显,需换一种逻辑重新说明。

5.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述命名实体包括必填词槽、非必填词槽,所述必填词槽包括被修正字、线索词组、组成成分中的一种或多种;所述非必填词槽包括组成成分词组、被修正字词组、指定序数词中的一种或多种。

6.根据权利要求5所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述步骤S5中基于拼音及数据库根据提取实体进行错字替换包括:

将提取实体和待处理文本信息转化为拼音,并进行匹配;

根据匹配结果确认正确字索引位置;

索引字正规化,并将文本信息中的索引字替换为正确字。

7.根据权利要求6所述的基于用户意图分析的语音识别矫正方法,其特征在于:在进行匹配前,当不存在修正字词组时,直接匹配得到正确字索引;当存在修正字词组时,先使用修正字词组匹配待选位置索引,再使用被修正字拼音在待索引里匹配位置索引。

8.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:所述步骤S5中数据库包括新华字典数据库,所述新华字典数据库为复合多元库,包括按中国拼音常用分析结果的词频顺序排列、以及每个字包含其拼音和组成成分,而所述组成成分包含其拼音、通俗讲法和通俗讲法的同义词。

9.根据权利要求1所述的基于用户意图分析的语音识别矫正方法,其特征在于:还包括根据输出的正确文本信息更新客制化字典数据库,所述客制化字典数据库用于存储用户的习惯性词。

10.基于用户意图分析的语音识别矫正系统,其特征在于:使用权利要求1-9任一所述的基于用户意图分析的语音识别矫正方法,其系统包括:

建立模块,用于建立客制化字典数据库;

获取模块,用于获取用户输入的语音信息,并根据客制化字典数据库转化为文本信息;

意图分析模块,用于根据所述文本信息进行意图分析;

命名实体模块,用于根据意图分析结果使用基于神经网络的BERT+BILSTM+CRF模型进行命名实体识别,并提取实体;

替换模块,用于基于拼音及数据库根据提取实体进行错字替换;

其中,所述替换模块包括转化单元、匹配单元,所述转化单元用于将提取实体和原文本信息转化为拼音;所述匹配单元用于将提取实体的拼音与原文本信息的拼音进行匹配,确认正确字索引位置

输出模块,用于输出正确文本信息;

更新模块,用于根据输出的正确文本信息更新客制化数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门万势顺易科技有限公司,未经厦门万势顺易科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111448714.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top