[发明专利]一种文本语义理解的方法和相关装置有效
申请号: | 202010010698.0 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111274823B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 张兆银;李直旭;陈志刚 | 申请(专利权)人: | 科大讯飞(苏州)科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘晓菲 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 语义 理解 方法 相关 装置 | ||
1.一种文本语义理解的方法,其特征在于,包括:
获取待语义理解的目标文本;
利用语义理解模型提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值;所述语义理解模型是基于不同领域下训练文本、训练文本的领域类型、槽值类型和对应的槽值,训练一个多任务生成式模型获得的;
基于所述目标文本的领域类型、槽值类型和对应的槽值,对所述目标文本进行文本语义理解;
其中,所述语义理解模型包括输入端和输出端;所述输入端包括字向量层和编码层,所述输出端包括解码层;对应地,所述利用语义理解模型提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值,包括:
基于所述目标文本和所述字向量层,获得所述目标文本的字向量;
基于所述目标文本的字向量和所述编码层,提取所述目标文本的语义信息获得所述目标文本的语义向量;
基于所述目标文本的语义向量和对应的所述解码层,获得所述目标文本的领域类型、槽值类型和对应的槽值。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本的字向量和所述编码层提取所述目标文本的语义信息,获得所述目标文本的语义向量,包括:
将所述目标文本的字向量输入所述编码层,获得所述目标文本的隐层向量;
基于所述目标文本的字向量和对应的第一权值,获得第一中间上下文向量;基于所述目标文本的隐层向量和对应的第二权值,获得第二中间上下文向量;
基于所述第一中间上下文向量和所述第二中间上下文向量,提取所述目标文本的语义信息获得所述目标文本的语义向量。
3.根据权利要求1所述的方法,其特征在于,所述解码层包括第一解码层和第二解码层;其中,当所述目标文本的领域类型为非闲聊时,所述第二解码层的输出为空,当所述目标文本的领域类型为闲聊时,所述第一解码层的输出为空。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述目标文本的槽值类型所属领域类型与所述目标文本的领域类型是否相同;
若是,基于所述目标文本的领域类型、槽值类型和对应的槽值响应所述目标文本;
若否,拒绝响应所述目标文本或询问所述目标文本。
5.一种文本语义理解的装置,其特征在于,包括:
获取单元,用于获取待语义理解的目标文本;
获得单元,用于利用语义理解模型提取所述目标文本的语义信息,基于所述语义信息同时获得所述目标文本的领域类型、槽值类型和对应的槽值;所述语义理解模型是基于不同领域下训练文本、训练文本的领域类型、槽值类型和对应的槽值,训练一个多任务生成式模型获得的;
语义理解单元,用于基于所述目标文本的领域类型、槽值类型和对应的槽值,对所述目标文本进行文本语义理解;
其中,所述语义理解模型包括输入端和输出端;所述输入端包括字向量层和编码层,所述输出端包括解码层;所述获得单元用于:
基于所述目标文本和所述字向量层,获得所述目标文本的字向量;
基于所述目标文本的字向量和所述编码层,提取所述目标文本的语义信息获得所述目标文本的语义向量;
基于所述目标文本的语义向量和对应的所述解码层,获得所述目标文本的领域类型、槽值类型和对应的槽值。
6.一种终端设备,其特征在于,所述终端设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的文本语义理解的方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的文本语义理解的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞(苏州)科技有限公司,未经科大讯飞(苏州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010698.0/1.html,转载请声明来源钻瓜专利网。