[发明专利]用于对话系统的指代消解方法、装置及存储介质在审
申请号: | 202210431596.5 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114818657A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 马伯睿;朱亚杰;王章定;魏德山;王波 | 申请(专利权)人: | 合众新能源汽车有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06K9/62 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 骆希聪 |
地址: | 314500 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 对话 系统 指代 消解 方法 装置 存储 介质 | ||
1.一种用于对话系统的指代消解方法,其特征在于,包括:
将对话系统接收到的句子进行编码,得到所述句子的句矩阵;
将所述句矩阵输入第一分类器组,获得所述句子的先行语的头索引和尾索引;
根据所述先行语的头索引和尾索引获得先行语向量;
将所述先行语向量与所述句矩阵作点积得到相关向量;
将所述相关向量输入第二分类器组,获得所述句子的一个或多个照应语的头索引和尾索引;
根据所述先行语的头索引和尾索引从所述句子中取出先行语,根据所述一个或多个照应语的头索引和尾索引从所述句子中取出一个或多个照应语,得到指代消解结果。
2.如权利要求1所述的指代消解方法,其特征在于,所述第一分类器组和所述第二分类器组中的分类器为二元分类器。
3.如权利要求2所述的指代消解方法,其特征在于,所述第一分类器组内的分类器表示为:
其中是句矩阵中第i个位置是先行语的索引的概率,hi是句矩阵中的第i个位置的向量,Want是第一权重矩阵,bant是第一偏置,σ是激活函数,softmax是归一化指数函数,softmax函数将的最大值设为1,其余值为0,是指示第i个位置是否为先行语的索引的结果。
4.如权利要求3所述的指代消解方法,其特征在于,所述第一分类器组包括
第一分类器,用于识别所述句子中的先行语的头索引;
第二分类器,用于识别所述句子中的先行语的尾索引。
5.如权利要求1所述的指代消解方法,其特征在于,根据所述先行语的头索引和尾索引获得先行语向量的步骤包括:
取出所述句矩阵中所述先行语的头索引和尾索引之间的所有向量;
将取出的所述所有向量求和得到先行语向量。
6.如权利要求2所述的指代消解方法,其特征在于,所述第二分类器组内的分类器表示为:
采用如下公式计算句矩阵中其第i个位置是照应语的索引的概率,
其中是句矩阵中其第i个位置是照应语的索引的概率,h′i是相关向量的第i个位置的向量,Wana是第二权重矩阵,bana是第二偏置,σ是激活函数;
设定第一阈值,将所述照应语的索引的概率大于第一阈值的分类结果设为1,否则,设为0。
7.如权利要求6所述的指代消解方法,其特征在于,所述第二分类器组包括:
第三分类器,用于识别所述句子中的照应语的头索引;
第四分类器,用于识别所述句子中的照应语的尾索引。
8.如权利要求1所述的指代消解方法,其特征在于,在根据所述一个或多个照应语的头索引和尾索引从所述句子中取出一个或多个照应语之前,还包括步骤:
将所述一个或多个照应语的头索引和尾索引进行一一配对,未出现头索引的尾索引或未出现尾索引的头索引不进行配对,最终得到一个或多个照应语的索引对。
9.如权利要求1所述的指代消解方法,其特征在于,通过预训练编码器对所述句子进行编码。
10.如权利要求9所述的指代消解方法,其特征在于,所述预训练编码器为具有构建上下文依赖能力的编码器。
11.如权利要求9所述的指代消解方法,其特征在于,所述句矩阵的大小为M*N,其中M为编码后每个字向量或词向量的维度,N为句子长度。
12.如权利要求1所述的指代消解方法,其特征在于,还包括:
对接收到的句子进行预处理,所述预处理包括分词、词性和去除停用词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合众新能源汽车有限公司,未经合众新能源汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210431596.5/1.html,转载请声明来源钻瓜专利网。