[发明专利]用于对话系统的指代消解方法、装置及存储介质在审
申请号: | 202210431596.5 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114818657A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 马伯睿;朱亚杰;王章定;魏德山;王波 | 申请(专利权)人: | 合众新能源汽车有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06K9/62 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 骆希聪 |
地址: | 314500 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 对话 系统 指代 消解 方法 装置 存储 介质 | ||
本发明涉及一种用于对话系统的指代消解方法,方法包括:将对话系统接收到的句子进行编码,得到句子的句矩阵;将句矩阵输入第一分类器组,获得句子的先行语的头索引和尾索引;根据先行语的头索引和尾索引获得先行语向量;将先行语向量与句矩阵作点积得到相关向量;将相关向量输入第二分类器组,获得句子的一个或多个照应语的头索引和尾索引;根据先行语的头索引和尾索引从句子中取出先行语,根据一个或多个照应语的头索引和尾索引从句子中取出一个或多个照应语,得到指代消解结果。本发明可以识别句子中同一个先行语所对应的多个照应语,为后续的对话内容处理提供更加完整的信息。
技术领域
本发明主要涉及自然语言处理领域,具体地涉及一种用于对话系统的指代消解方法、装置及存储介质。
背景技术
指代消解旨在识别句子中同一实体的多种不同表述方式。在智能座舱的对话系统中,用户时常会习惯性的使用代词来指代在前文中提到过的人、物、概念等实体以避免重复的字、词出现在对话中。例如用户在智能座舱中向语音助手询问:“昨天晚上有国足的比赛,他们进了几个球?他们进了几个乌龙球”,该句子中“他们”即是“国足”的代替表达方式。通常我们称句子中的“国足”为先行语(Antecedent),“他们”为照应语(Anaphor)。这种人类的直觉性的表达方式在由计算机解析时常会由于结构不够清晰而产生指代消解问题,造成句子的错误理解,从而导致糟糕的用户体验甚至在驾驶过程中产生危险。
在一些方案中,将指代消解问题转化为照应语-先行语联合最优解的问题,将照应语-先行语输入联合模型中,求模型的最优解以获得照应语对应的先行语。但是该方案照应语与先行语是一一对应的,无法识别句子中同一个先行语所对应的多个照应语。
发明内容
本发明所要解决的技术问题是提供一种用于对话系统的指代消解方法、装置及存储介质,可以识别句子中同一个先行语所对应的多个照应语。
本发明提供一种用于对话系统的指代消解方法,包括:将对话系统接收到的句子进行编码,得到所述句子的句矩阵;将所述句矩阵输入第一分类器组,获得所述句子的先行语的头索引和尾索引;根据所述先行语的头索引和尾索引获得先行语向量;将所述先行语向量与所述句矩阵作点积得到相关向量;将所述相关向量输入第二分类器组,获得所述句子的一个或多个照应语的头索引和尾索引;根据所述先行语的头索引和尾索引从所述句子中取出先行语,根据所述一个或多个照应语的头索引和尾索引从所述句子中取出一个或多个照应语,得到指代消解结果。
在本发明的一实施例中,所述第一分类器组和所述第二分类器组中的分类器为二元分类器。
在本发明的一实施例中,所述第一分类器组内的分类器可表示为:
其中是句矩阵中第i个位置是先行语的索引的概率,hi是句矩阵中的第i个位置的向量,Want是第一权重矩阵,bant是第一偏置,σ是激活函数,softmax是归一化指数函数,softmax函数将的最大值设为1,其余值为0,是指示第i个位置是否为先行语的索引的结果。
在本发明的一实施例中,所述第一分类器组包括第一分类器,用于识别所述句子中的先行语的头索引;第二分类器,用于识别所述句子中的先行语的尾索引。
在本发明的一实施例中,根据所述先行语的头索引和尾索引获得先行语向量的步骤包括:取出所述句矩阵中所述先行语的头索引和尾索引之间的所有向量;将取出的所述所有向量求和得到先行语向量。
在本发明的一实施例中,所述第二分类器组内的分类器可表示为:采用如下公式计算句矩阵中第i个位置是照应语的索引的概率,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合众新能源汽车有限公司,未经合众新能源汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210431596.5/2.html,转载请声明来源钻瓜专利网。