[发明专利]一种语音识别纠错方法及人机对话系统有效

专利信息
申请号: 201910717838.5 申请日: 2019-08-05
公开(公告)号: CN110428822B 公开(公告)日: 2022-05-03
发明(设计)人: 兰飞 申请(专利权)人: 重庆电子工程职业学院
主分类号: G10L15/18 分类号: G10L15/18;G10L15/22;G10L15/26;G10L15/04;G06F40/232
代理公司: 重庆强大凯创专利代理事务所(普通合伙) 50217 代理人: 陈家辉
地址: 401331 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 识别 纠错 方法 人机对话 系统
【说明书】:

发明涉及语音识别纠错技术领域,具体为一种语音识别纠错方法及人机对话系统,该方法包括以下步骤:获取语音识别结果和候选语义片段以及语音识别结果的拼音和候选语义片段的拼音;将语音识别结果和候选语义片段进行组合,形成若干新的纠错文本,计算纠错文本的组合分数,根据组合分数筛选纠错文本得到纠错候选列表;语言模型优化步骤,利用语言模型计算语言模型评分,并根据组合分数和语言模型评分生成最终纠错列表。本发明提供的一种语音识别纠错方法及人机对话系统,可以在语音识别错误后,更加准确的匹配出纠错文本,有效的减少语音识别的结果对中文人机对话流程的跳转影响,提高人机对话质量。

技术领域

本发明涉及语音识别纠错技术领域,具体为一种语音识别纠错方法及人机对话系统。

背景技术

人机对话技术的研究最早可以追溯到上世纪六十年代,自阿兰·图灵提出通过图灵测试来检验机器是否具有人类智能的设想以来,研究人员就开始致力于人机对话系统的研究。目前,市面上有众多人机对话的产品,如智能语音助手、电话机器人等,这些产品中语音识别技术都是非常重要的模块。由于用户的非标准化表达、方言、环境噪声等因素,导致错误的语音识别结果,这是导致人机对话失败的主要原因。

我国语音识别研究工作起步于五十年代,近年来由于深度学习技术的推动,语音识别技术发展很快。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。国内语音识别技术领先的单位有科大讯飞、阿里、百度等互联网巨头厂商。这些厂商在汉语语音识别上投入了巨大的人力和财力,在各类学术竞赛中获得领先水平,在实际的工业生产中,收集了大量的模型训练语料,在短时间内形成了语音识别的技术高地。目前,考虑到语音识别的效果,国内很多的人机交互产品选择采用互联网巨头语音识别技术。但是,在特定的交互场景下,互联网巨头语音识别技术仍有很大的不足,尤其是大量环境噪声下的短文本识别。此时,由于无法直接修改语音识别模型,只能够致力于将语音识别结果映射到场景相关的文本上去。在人机对话过程中,预设了用户的说话语义范围,而在语音识别中并没有这个假设,所以,采用中文人机对话中的候选语料纠正语音识别结构,对于提高人机对话质量有重要的意义。

发明内容

本发明意在提供一种语音识别纠错方法及一种人机对话系统,可以在语音识别错误后,更加准确的匹配出纠错文本,有效的减少语音识别的结果对中文人机对话流程的跳转影响,提高人机对话质量。

为了解决上述技术问题,本申请提供如下技术方案:

一种语音识别纠错方法,包括以下步骤:

获取语音识别结果和候选语义片段以及语音识别结果的拼音和候选语义片段的拼音;

将语音识别结果和候选语义片段进行组合,形成若干新的纠错文本,计算语音识别结果和候选语义片段的拼音相似度和纠错文本的组合分数,根据组合分数筛选纠错文本得到纠错候选列表;

语言模型优化步骤,利用语言模型计算语言模型评分,并根据组合分数和语言模型评分生成最终纠错列表。

本发明技术方案中,通过使用拼音空间相似度算法,并采用了动态规划方法计算最优语义文本组合,形成纠错候选列表,可以更加准确的匹配出正确的语义文本,并且,通过采用拼音空间相似度算法和语言模型融合的方式,不仅仅从发音上,更结合字符串之间本身的语义关系,可以避免纠错候选列表中存在语序不通、同音错别字等问题,进一步提高匹配的准确度。将其应用于人机对话系统后,可以有效的减少语音识别的结果对中文人机对话流程的跳转影响,提高人机对话质量。

进一步,计算各个语义文本的拼音相似度评分具体包括以下步骤:

计算语音识别结果的拼音对应的字符串的子字符串和候选语义片段之间的拼音相似度,形成相似度矩阵Mk

根据拼音相似度计算组合分数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆电子工程职业学院,未经重庆电子工程职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910717838.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top