[发明专利]一种基于增强问题重要性表示的答案选择算法在审
申请号: | 201911143753.7 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110674280A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 琚生根;谢正文;熊熙;孙界平 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 51304 成都东恒知盛知识产权代理事务所(特殊普通合伙) | 代理人: | 何健雄;廖祥文 |
地址: | 610064 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 句子 答案 答案选择 算法 注意力机制 语义信息 噪声 捕捉 相似度矩阵 交互矩阵 句子向量 问题向量 对齐 融合 编码层 多窗口 细粒度 构建 权重 向量 选项 缓解 赋予 网络 | ||
1.一种基于增强问题重要性表示的答案选择算法,其特征在于:步骤如下:
S1,将问题和答案通过BiLSTM编码层对问题和答案进行编码;
S2,编码后的问题利用自注意力机制得到新的问题向量;
S3,将问题和答案构建词级相似度矩阵进行对齐;
S4,捕捉多粒度的语义信息,将不同粒度的向量进行融合比较;
S5,通过多窗口CNN来提取融合特征,得出最佳选项。
2.根据权利要求1所述基于增强问题重要性表示的答案选择算法,其特征在于:所述在步骤S1中Q为问题,答案为A,用Hq={hq1,...,hqm}和Ha={ha1,...,han}来表示问题句向量和答案句向量,是句子Hq的第i个词嵌入,m和n分别表示问题和答案的长度;
问题和答案通过BiLSTM编码层捕捉到句子上下文的信息,LSTM的隐层维度为u,在t时刻的嵌入词为xt,前一时刻的隐层和记忆单元分别为ht-1和ct-1,下一时刻的隐层ht和记忆单元ct计算如下:
gt=φ(Wgxt+Vght-1+bg),
it=σ(Wixt+Wiht-1+bi),
ft=σ(Wfxt+Wfht-1+bf),
ot=σ(Woxt+Woht-1+bo),
ct=gt⊙it+ct-1⊙ft,
ht=ct⊙ot
其中,的,σ和φ分别是sigmoid函数和tanh函数,⊙表示两个向量进行元素相乘,输入门i,遗忘门f和输出门o能够自动的控制信息的流动,同时记忆单元ct可以记住长距离的信息ht是t时刻的向量表示。
3.根据权利要求1所述的基于增强问题重要性表示的答案选择算法,其特征在于:所述步骤S2中对步骤S1中得到问题的句子Tq={tq1,...,tqm}和答案的句子Ta={ta1,...,tan},其中对问题中的每个词进行计算权重并更新权重,生成新的问题向量表示。所述新的向量计算公式为:
v=TqW1;其中
αq=sigmoid(v);其中
Uq=αq⊙Tq;其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143753.7/1.html,转载请声明来源钻瓜专利网。