[发明专利]语句的处理方法、装置及电子设备在审
申请号: | 202111355670.1 | 申请日: | 2021-11-16 |
公开(公告)号: | CN114239601A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 杨善松;王敏 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/289;G06F40/284;G06F40/44;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;刘芳 |
地址: | 266555 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 处理 方法 装置 电子设备 | ||
1.一种语句的处理方法,其特征在于,包括:
获取待处理语句;其中,所述待处理语句是通过识别语音数据得到的,所述待处理语句包括顺序排列的多个文字;
对所述待处理语句进行分词,得到多个词语,并确定每个词语对应的一个或多个标签信息;
将所述多个词语以及每个词语对应的标签信息输入多头注意力机制模型,得到概率矩阵;所述概率矩阵包括所述每个词语对应的所述一个或多个标签信息中每个标签信息的概率值;
根据所述概率矩阵,确定所述待处理语句中每个词语对应的一个标签信息和所述待处理语句的意图信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述多个词语以及每个词语对应的一个或多个标签信息输入多头注意力机制模型,包括:
根据所述待处理语句中多个文字的字特征向量,得到多个第一特征矩阵;
根据所述语句中每个文字对应的标签信息的特征向量,得到多个第二特征矩阵;
将所述多个第一特征矩阵和所述多个第二特征矩阵输入所述多头注意力机制模型。
3.根据权利要求2所述的方法,其特征在于,所述多头注意力机制模型被配置为,
根据历史语句学习结果,确定所述第一特征矩阵中的每个文字,在所述第二特征矩阵中所在的词语所对应的一个或多个标签信息一起出现的概率值,根据所述多个词语的概率值组成所述概率矩阵;
其中,所述历史语句学习结果是根据多个语句,及语句中每个文字对应的一个标签信息输入所述多头注意力机制模型训练得到的。
4.根据权利要求3所述的方法,其特征在于,所述多头注意力机制模型得到所述概率矩阵M的公式包括:
其中,Q为所述第一特征矩阵,K和V为所述第二特征矩阵,dk为指定的标签信息嵌入所述第二特征矩阵时的向量维度。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述待处理语句进行分词,得到多个词语,并确定每个词语对应的一个或多个标签信息,包括:
将所述待处理语句通过ANSJ分词算法得到所述多个词语;
根据映射表确定每个词语对应的一个或多个标签信息,所述映射表包括多个词语,以及每个词语与一个或多个标签信息的对应关系。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述概率矩阵,确定所述待处理语句中每个词语对应的一个标签信息和所述待处理语句的意图信息,包括:
通过Transform编码对所述概率矩阵进行处理得到特征矩阵;
通过全连接层对所述特征矩阵中每个文字进行槽位分类和意图分类,得到所述待处理语句中的词槽信息和意图信息。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取多个训练语句,并确定每个训练语句中每个文字对应的标签信息;
将所述多个训练语句以及每个训练语句中每个文字对应的标签信息输入入所述多头注意力机制模型,使所述多头注意力机制模型训练得到所述历史语句学习结果。
8.根据权利要求1-4任一项所述的方法,其特征在于,所述确定所述待处理语句中每个词语对应的一个标签信息和所述待处理语句的意图信息之后,还包括:
存储所述待处理语句中每个词语的标签信息和所述意图信息的对应关系;
当再次接收到后续语句,且所述后续语句中的多个词语的标签信息与所述待处理语句中多个词语的标签信息相同时,根据所述对应关系确定所述后续语句中每个词语对应的标签信息和所述后续语句的意图信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111355670.1/1.html,转载请声明来源钻瓜专利网。