[发明专利]基于多模式标识的语义识别方法、装置和计算机设备有效
申请号: | 202010733121.2 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111883112B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 邹芳;曹磊;李沛恒 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/24;G10L15/26;G10L15/02;G10L15/04;G10L15/06;G10L25/30;G10L25/60;G06N3/04;G06N3/08;G06N20/10;G06F40/30 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模式 标识 语义 识别 方法 装置 计算机 设备 | ||
1.一种基于多模式标识的语义识别方法,其特征在于,应用于第一移动终端,包括:
通过所述第一移动终端上预设的收音设备,获取输入的第一语音信息;
将所述第一语音信息输入预设的第一语音识别模型中进行处理,从而得到所述第一语音识别模型输出的第一识别结果;其中所述第一识别结果由至少一个识别组构成,每个识别组均包括一个识别语义文本和一个行为模式标识;
判断所述第一识别结果是否包括两个以上的识别组;
若所述第一识别结果包括两个以上的识别组,则根据预设的行为特征语音提取方法,从所述第一语音信息中提取至少两个行为特征语音片段,其中所述至少两个行为特征语音片段两两之间在时间上不连续;
将所述至少两个行为特征语音片段输入预设的第一行为模式识别模型中进行处理,从而得到所述第一行为模式识别模型输出的第一行为模式标识;
通过所述第一移动终端的侧面预设的压力传感器,感测得到所述第一移动终端的使用者的手指压力信号,以及,通过所述第一移动终端的背面预设的温度传感器,感测得到所述第一移动终端的使用者的手掌的掌心温度信号;其中,所述第一移动终端的背面指与所述第一移动终端的屏幕面相反的一面;
将所述手指压力信号和所述掌心温度信号输入预设的第二行为模式识别模型中进行处理,从而得到所述第二行为模式识别模型输出的第二行为模式标识;
判断所述第一行为模式标识与所述第二行为模式标识是否匹配,以及判断所述第一行为模式标识是否存在于所述第一识别结果中;
若所述第一行为模式标识与所述第二行为模式标识匹配,并且所述第一行为模式标识存在于所述第一识别结果中,则从所述第一识别结果中选出指定识别组,其中所述指定识别组中的行为模式标识为所述第一行为模式标识;
将所述指定识别组中的识别语义文本作为对应于所述第一语音信息的最终识别结果。
2.根据权利要求1所述的基于多模式标识的语义识别方法,其特征在于,所述第一语音信息是实时获取的语音信息,所述第一语音识别模型包括顺序连接的编码用长短期记忆网络和解码用长短期记忆网络,所述将所述第一语音信息输入预设的第一语音识别模型中进行处理,从而得到所述第一语音识别模型输出的第一识别结果;其中所述第一识别结果由至少一个识别组构成,每个识别组均包括一个识别语义文本和一个行为模式标识的步骤,包括:
执行第一次编码操作,所述第一次编码操作指实时获取第一时长的子语音信息,并将所述第一时长的子语音信息输入预设的第一语音识别模型中的编码用长短期记忆网络进行处理,从而得到所述编码用长短期记忆网络输出的第一隐藏状态向量序列;
执行第一次解码操作,所述第一次解码操作指将所述第一隐藏状态向量序列输入所述第一语音识别模型中的解码用长短期记忆网络中进行处理,从而得到所述解码用长短期记忆网络输出的第一子识别语义文本和与所述第一子识别语义文本对应的行为模式标识;
依次执行第二次编码操作、第二次解码操作、...、第n次编码操作、第n次解码操作,其中所述第二次编码操作指实时获取第二时长的子语音信息,并将所述第二时长的子语音信息输入预设的第一语音识别模型中的编码用长短期记忆网络进行处理,从而得到所述编码用长短期记忆网络输出的第二隐藏状态向量序列,并且所述第二时长与所述第一时长的差值等于预设时间差;所述第二次解码操作指将所述第二隐藏状态向量序列输入所述第一语音识别模型中的解码用长短期记忆网络中进行处理,从而得到所述解码用长短期记忆网络输出的第二子识别语义文本和与所述第二子识别语义文本对应的行为模式标识;...;所述第n次编码操作指实时获取第n时长的子语音信息,并将所述第n时长的子语音信息输入预设的第一语音识别模型中的编码用长短期记忆网络进行处理,从而得到所述编码用长短期记忆网络输出的第n隐藏状态向量序列,并且所述第n时长与第n-1时长的差值等于预设时间差,所述第n时长的子语音信息等于所述第一语音信息;所述第n次解码操作指将所述第n隐藏状态向量序列输入所述第一语音识别模型中的解码用长短期记忆网络中进行处理,从而得到所述解码用长短期记忆网络输出的第n子识别语义文本和与所述第n子识别语义文本对应的行为模式标识;
根据预设的数据合并方法,对第一子识别语义文本和与第一子识别语义文本对应的行为模式标识、第二子识别语义文本和与第二子识别语义文本对应的行为模式标识、...以及第n子识别语义文本和与第n子识别语义文本对应的行为模式标识进行合并处理,从而得到所述第一识别结果;其中所述第一识别结果由至少一个识别组构成,每个识别组均包括一个识别语义文本和一个行为模式标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010733121.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种渔网生产用聚乙烯原料自动上料装置
- 下一篇:一种聚酰亚胺隔膜及其制备方法