[发明专利]一种面向深度答案推荐模型的主动学习方法有效
申请号: | 202011491346.8 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112487172B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 吴文峻;汪群博;赵永驰;辛治旻 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06N3/0464;G06N3/08;G06F18/214 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 深度 答案 推荐 模型 主动 学习方法 | ||
1.一种面向深度答案推荐模型的主动学习方法,其特征在于,具体步骤如下:
步骤一、针对某个线上社区问答平台,将该平台中的每个问题和对应的若干候选答案分别作为一个样本;
步骤二、利用该平台通常采用的深度答案推荐模型通过dropout构建贝叶斯神经网络,包括在神经网络的每层权重前设置dropout机制;
步骤三、利用贝叶斯神经网络计算每个样本的近似期望损失;
具体过程如下:
步骤301、针对包含一个问题文本q1和多个候选答案文本{a1,…,aJ}的当前样本X,将其视为问答对集合{(q1,a1),(q1,a2),…,(q1,aJ)},将每个问答对分别输入神经网络,并开启dropout机制,进行随机前向传播来分别获得每个问答对的匹配分数,即Y={Y1,…,YJ};
步骤302、对当前样本X进行T次随机前向传播来近似其后验预测分布;
计算公式为:
DL为当前已有的标注数据;ω为深度答案推荐模型的参数;为第t次随机前向传播下的模型参数;
步骤303、利用当前样本X,计算每次随机前向传播时对应的每个候选答案的匹配分数,并进一步计算通用指标DCG并求其期望;
具体为:
首先,计算第t次随机前向传播时,神经网络对样本X的第j个候选答案预测匹配分数为Yjt;
然后,当前样本X所有候选答案根据匹配分数进行从大到小的排序得到πt,计算排序πt的质量衡量通用指标DCG;最后求T次排序对应DCG的期望值;
计算公式如下:
Yt为基于的模型预测匹配分数的结果;其中,
πt(j)为第j个候选答案在排序πt中的位置;
步骤304、利用当前样本X,计算每次随机前向传播时对应的每个候选答案的后验匹配分数,并进一步计算通用指标DCG并求其期望;
具体为:
首先,利用第t次随机前向传播时,神经网络对样本X的第j个候选答案预测匹配分数为Yjt,计算第j个候选答案的后验匹配分数
然后,将样本X所有候选答案根据后验匹配分数从大到小进行排序,得到π*,计算排序π*在第t次预测匹配分数下的通用指标DCG;最后求期望值;
公式为:
步骤305、利用由匹配分数和后验匹配分数得到的通用指标DCG期望值计算各样本对应的近似期望损失;
样本X的期望损失表示如下:
π为候选答案基于匹配分数从大到小的排序;Y={Y1,Y2,…}为所有候选答案的匹配分数集合;
步骤四、将各样本按照对应的期望损失按从大到小排序,并选取前K个作为待标注数据样本;
K的具体选择人为根据需求设定;
步骤五、将前K个样本中的每个样本,各样本分别分给三个用户,进行最优答案的人工标注,并将标注结果进行融合;
步骤六、将各样本及其标注融合结果加入已标注数据集,并训练当前线上社区问答平台的深度答案推荐模型;
步骤七、判断深度答案推荐模型是否达到收敛且最优性能,如果是,利用训练好的深度答案推荐模型直接对新的问题,推荐出最优的答案;否则,重复步骤一到六,继续提高模型性能。
2.如权利要求1所述的一种面向深度答案推荐模型的主动学习方法,其特征在于,所述步骤301具体为:神经网络将每个问答对中的问题文本和候选答案文本分别进行编码,然后拼接成一个特征向量,经过全连接层和softmax层输出概率作为当前候选答案对于该问题的匹配分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011491346.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人工角膜
- 下一篇:一种耐冻贴标的压敏胶粘剂及制备方法和应用