[发明专利]语音识别方法和装置在审
申请号: | 201710861589.8 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107464566A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 孙孝雄 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/63 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
技术领域
本发明涉及信息处理技术领域,尤其涉及一种语音识别方法和装置。
背景技术
随着科技的不断进步,语音识别技术取得了显著的进步,智能化时代的到来,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。目前,语音识别主要是解析用户说话的内容,理解用户的意图,从而与用户进行简单的交互,例如接收用户的语音指令,执行一些简单的操作,或者与用户进行简单的对话。但是,当用户输入一句语音,如“给我播放一首歌曲”时,目前的语音识别系统,通常只会为用户说话的内容进行解析,根据解析结果随机推荐一首歌曲,而用户在说话时还包括更多的信息,并没用充分的加以利用,因此无法理解更深层次的用户的行为意图。
发明内容
本发明提供一种语音识别方法和装置,以解决上述技术问题中的至少一个。
本发明实施例提供一种语音识别方法,包括:获取用户输入的语音信息;基于命名实体识别系统识别出所述语音信息中的实体信息;获取所述用户输入所述语音信息时的语速信息和音量信息;以及基于深度学习情感分析模型,根据所述实体信息、所述语速信息和所述音量信息,识别出所述语音信息对应的情感信息。
可选的,基于命名实体识别系统识别出所述语音信息中的实体信息,包括:对所述语音信息进行分析,获得分析结果;根据所述分析结果识别出所述实体信息。
可选的,对所述语音信息进行分析,获得分析结果,包括:对所述语音信息进行预处理、分词、词性标注处理,以获得所述分析结果。
可选的,基于深度学习情感分析模型,根据所述实体信息、所述语速信息和所述音量信息,识别出所述语音信息对应的情感信息,包括:将所述实体信息、所述语速信息和所述音量信息作为特征信息输入至深度学习情感分析模型;基于预设情感词典,通过所述深度学习情感分析模型识别出所述情感信息。
可选的,在获取用户输入的语音信息之后,还包括:对所述语音信息进行语义解析,并生成语义解析结果;根据所述语义解析结果和所述情感信息向所述用户反馈与所述语音信息相对应的结果信息。
本发明另一实施例提供一种语音识别装置,包括:第一获取模块,用于获取用户输入的语音信息;识别模块,用于基于命名实体识别系统识别出所述语音信息中的实体信息;第二获取模块,用于获取所述用户输入所述语音信息时的语速信息和音量信息;以及情感分析模块,用于基于深度学习情感分析模型,根据所述实体信息、所述语速信息和所述音量信息,识别出所述语音信息对应的情感信息。
可选的,所述识别模块,用于:对所述语音信息进行分析,获得分析结果;根据所述分析结果识别出所述实体信息。
可选的,所述识别模块,具体用于:对所述语音信息进行预处理、分词、词性标注处理,以获得所述分析结果。
可选的,所述情感分析模块,用于:将所述实体信息、所述语速信息和所述音量信息作为特征信息输入至深度学习情感分析模型;基于预设情感词典,通过所述深度学习情感分析模型识别出所述情感信息。
可选的,所述装置还包括:语义解析模块,用于在获取用户输入的语音信息之后,对所述语音信息进行语义解析,并生成语义解析结果;反馈模块,用于根据所述语义解析结果和所述情感信息向所述用户反馈与所述语音信息相对应的结果信息。
本发明还一实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明第一方面实施例所述的语音识别方法。
本发明又一实施例提供一种终端设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器用于执行本发明第一方面实施例所述的语音识别方法。
本发明实施例提供的技术方案可以包括以下有益效果:
通过获取用户输入的语音信息,并基于命名实体识别系统识别出所述语音信息中的实体信息,再获取所述用户输入所述语音信息时的语速信息和音量信息,以及基于深度学习情感分析模型,根据所述实体信息、所述语速信息和所述音量信息,识别出所述语音信息对应的情感信息,从而将情感信息作为语音识别的重要因素,帮助提高语音识别的准确率,更加符合用户的真实需求。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的语音识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710861589.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种远场语音唤醒方法及设备
- 下一篇:语音识别方法及装置