[发明专利]语音识别结果的确定方法及装置、存储介质及电子装置有效
申请号: | 202110129021.3 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112836522B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 张卓博;苏腾荣;赵培;孙雨新 | 申请(专利权)人: | 青岛海尔科技有限公司;海尔智家股份有限公司 |
主分类号: | G06F40/44 | 分类号: | G06F40/44;G06N3/0455;G06N3/0442;G06N3/08;G10L15/22;G10L15/26 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵静 |
地址: | 266101 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 结果 确定 方法 装置 存储 介质 电子 | ||
1.一种语音识别结果的确定方法,其特征在于,包括:
将待识别的语音指令转换为第一文本信息,并将所述第一文本信息转换为第一音素串信息;
将所述第一音素串信息输入到编码解码模型中,得到对第二文本信息,其中,所述编码解码模型保存有字或词的时序关系,所述时序关系用于指示所述字后接的出现概率最大的字或词语,以及所述词语后接的出现概率最大的字或词语,通过多次束搜索的方式最终得到推理结果中可能性最大的推理结果作为所述第二文本信息;
其中,根据所述时序关系对所述第一音素串信息依次进行编码操作和解码操作,以确定所述第一音素串对应的第二文本信息,包括:
通过多个长短期记忆网络模型对所述第一音素串信息进行编码操作,得到编码结果,其中,所述编码解码模型包括:所述多个长短期记忆网络,且所述多个长短期记忆网络模型保存有所述时序关系及所有字与字或字与词的逻辑关系,通过束搜索的方式对所述编码结果进行解码操作,通过所述编码解码模型的逻辑关系对所述第一文本信息进行推理,得到所述第二文本信息;
确定所述第一文本信息的第一置信度和所述第二文本信息的第二置信度,将所述第一置信度和所述第二置信度中高置信度所对应的文本信息作为所述语音指令的语音识别结果;
确定所述第一文本信息的第一置信度和所述第二文本信息的第二置信度,包括:
将所述第一文本信息划分为字或词语连接的第三文本信息,以及将所述第二文本信息划分为字或者词连接的第四文本信息;通过困惑度打分机制分别对所述第三文本信息和所述第四文本信息打分,得到所述第一文本信息的第一置信度和所述第二文本信息的第二置信度。
2.根据权利要求1所述的方法,其特征在于,将所述第一音素串信息输入到编码解码模型中,得到对第二文本信息,包括:
获取所述编码解码模型中保存的所述时序关系;
根据所述时序关系对所述第一音素串信息依次进行编码操作和解码操作,以确定所述第一音素串对应的第二文本信息。
3.根据权利要求1所述的方法,其特征在于,通过束搜索的方式对所述编码结果进行解码操作,得到第二文本,包括:
通过束搜索的方式对所述编码结果进行解码操作,得到多个解码结果;
通过基于向量点积的注意力机制从所述多个解码结果中确定与所述第一音素串信息相似度最高的目标解码结果作为所述第二文本信息。
4.根据权利要求1所述的方法,其特征在于,将所述第一文本信息转换为第一音素串信息,包括:
获取所述第一文本信息;
通过自然语言处理NLP技术将所述第一文本信息转换为第一音素串信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海尔科技有限公司;海尔智家股份有限公司,未经青岛海尔科技有限公司;海尔智家股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110129021.3/1.html,转载请声明来源钻瓜专利网。