[发明专利]语音识别方法、装置、设备和存储介质在审

申请号：	201811534858.0	申请日：	2018-12-14
公开（公告）号：	CN109545203A	公开（公告）日：	2019-03-29
发明（设计）人：	俞诗洪	申请（专利权）人：	深圳壹账通智能科技有限公司
主分类号：	G10L15/18	分类号：	G10L15/18;G10L15/22;G10L15/26
代理公司：	北京中强智尚知识产权代理有限公司 11448	代理人：	黄耀威
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语义语音识别音词会话存储介质语音信息澄清用户输入语音计算机设备上下文确定一对一会话交互模式交互识别用户确定用户确认语音模型同音词检测准确率对话回复场景
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例涉及一种语音识别方法、装置、计算机设备和存储介质，所述方法包括：在检测到用户输入语音后，建立与该用户的对话，在对语音信息进行语音识别的过程中若检测到对应多个语义的同音词，则发起针对该多音词的澄清对话，以让用户确定多音词的正确语义，最后根据用户的回复以及会话中的上下文确定多音词的正确语义。相比于现有的单交互识别的模式，本发明实施例采用人机双交互模式，通过建立与用户的一对一会话，能够为语音识别提供场景支持，使得语音模型能够通过会话中的上下文更好的理解语音信息所表达的语义。此外，本发明实施例提供的方法对于多音词还能够发起澄清会话，以让用户确认多音词的语义，从而能够提高语音识别的准确率。

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及的语音识别方法、装置、计算机设备和存储介质。

背景技术

语音识别目前是一个较为热门的技术领域。语音识别技术可以应用到诸多产品中，例如手机、可穿戴设备、智能家居等等。用户通过语音即可控制设备进行一定的操作。目前平台上的语音识别技术只是一种传统的单交互识别。也即机器只回答本次的问题，只局限在单轮对话里。

例如：

用户：“中山”有什么好吃的？

机器：好，我找到了以下餐馆:(会默认给用户推荐附近餐馆)

用户：我不想吃饭。

机器：好的。

然而，在这样的语音识别模式中，机器只回答本次的问题，只局限在单轮对话里，缺乏语言场景支持，且这种单交互式的语音识别方式对于同音词、多义词的识别率的正确率较低。

发明内容

基于此，本发明实施例提供了一种语音识别方法、装置、设备和存储介质，用于提高语音识别过程中同音词的识别正确率。