[发明专利]短文本相似度匹配的语音问答方法、设备及存储介质在审
申请号: | 202211569540.2 | 申请日: | 2022-12-08 |
公开(公告)号: | CN116383338A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 马坚;李敏;曾谁飞;刘卫强;孔令磊;张景瑞 | 申请(专利权)人: | 青岛海尔电冰箱有限公司;海尔智家股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G10L15/26;G10L15/18;G10L13/02;G10L21/0208;G06F18/25;G06F18/2413 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 沈晓敏 |
地址: | 266101 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 相似 匹配 语音 问答 方法 设备 存储 介质 | ||
本发明公开了一种短文本相似度匹配的语音问答方法,包括以下步骤:根据用户语音和对应的语音文本,提取语音特征和语音文本特征;融合所述语音特征和语音文本特征,以产生融合特征;利用特征相似度打分模型,依次对所述融合特征和候选集合中的融合特征进行打分,以得到多个评分;若所述评分大于第一预设阈值,则获取该评分对应的候选文本,以得到候选文本集合;判断所述候选文本集合中的每个候选文本与所述语音文本的语义相似度或编辑距离是否在预设范围内,基于判断结果,决定处理方式,输出最佳候选文本;根据所述最佳候选文本,获得与之匹配的应答文本并将其转换成语音输出。该方法不仅提升了会话系统质量,而且也提高了用户满意度。
技术领域
本发明涉及冰箱问答系统技术领域,尤其涉及一种基于冰箱问答系统的短文本相似度匹配方法、制冷设备及存储介质。
背景技术
在当前智能冰箱食材管理领域,如何在冰箱问答系统中根据用户发出的语音获得最佳的答复是该领域常见的一种问题,解决该问题一般采用文本相似度算法,而文本相似度的计算方法有很多,主要包括两方面:一是单独通过语义相似度来计算,另外一种是直接使用编辑距离或者海明距离等方式计算两个文本之间的相似距离,以实现文本相似度的比较。
以上两种方法都有各自的缺点,在计算语义相似度时,因为文本的特征提取仅仅来源于文本,如果文本中出现了错别字等问题,模型是无法正确捕捉到文本特征的;而编辑距离通过统计两个文本之间转换所经过的操作步骤来判断两个文本的相似度,对语义相同的但是文字不同的文本会出现误判,比如“添加油”与“加油呀”仅仅相差一个字,但是语义却与原文本不相同。
发明内容
本发明的目的在于提供一种短文本相似度匹配的语音问答方法、设备及存储介质。
为了实现上述发明目的,本发明提供一种短文本相似度匹配的语音问答方法,所述方法包括步骤:根据用户语音和对应的语音文本,提取语音特征和语音文本特征;融合所述语音特征和语音文本特征,以产生融合特征;利用特征相似度打分模型,依次对所述融合特征和候选集合中的融合特征进行打分,以得到多个评分;若所述评分大于第一预设阈值,则获取该评分对应的候选文本,以得到候选文本集合;判断所述候选文本集合中的每个候选文本与所述语音文本的语义相似度或编辑距离是否在预设范围内,基于判断结果,决定处理方式,输出最佳候选文本;根据所述最佳候选文本,获得与之匹配的应答文本并将其转换成语音输出。
作为本发明的进一步改进,所述“判断所述候选文本集合中的每个候选文本与所述语音文本的语义相似度或编辑距离是否在预设范围内”具体包括:若所述候选文本集合中的每个候选文本与所述语音文本的语义相似度在预设阈值范围内,则计算所述语音文本与该候选文本的编辑距离,得到多个编辑距离值;对所述多个编辑距离值进行排序,以获得最大编辑距离值对应的候选文本。
作为本发明的进一步改进,所述“判断所述候选文本集合中的每个候选文本与所述语音文本的语义相似度或编辑距离是否在预设范围内”具体包括:若所述候选文本集合中的每个候选文本与所述语音文本的语义相似度大于第二预设阈值,则对所述多个语义相似度进行排序,以获得最大语义相似度对应的候选文本。
作为本发明的进一步改进,所述“判断所述候选文本集合中的每个候选文本与所述语音文本的语义相似度或编辑距离是否在预设范围内”具体包括:若所述候选文本集合中的每个候选文本与所述语音文本的编辑距离在预设阈值范围内,则计算所述语音文本与该候选文本的语义相似度,得到多个相似度值;对所述多个相似度值进行排序,以获得最大相似度值对应的候选文本。
作为本发明的进一步改进,所述“判断所述候选文本集合中的每个候选文本与所述语音文本的语义相似度或编辑距离是否在预设范围内”具体包括:若所述候选文本集合中的每个候选文本与所述语音文本的编辑距离大于第二预设阈值,则对所述多个编辑距离值进行排序,以获得最大编辑距离值对应的候选文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海尔电冰箱有限公司;海尔智家股份有限公司,未经青岛海尔电冰箱有限公司;海尔智家股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211569540.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动测量玻璃副像偏离的装置
- 下一篇:停车场车道监控系统、管理系统、管理方法