[发明专利]一种利用非对称的多面排序网络学习解决社区问答任务的方法在审
申请号: | 201711227321.5 | 申请日: | 2017-11-29 |
公开(公告)号: | CN108153816A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 赵洲;孟令涛;林志杰;蔡登;何晓飞;庄越挺 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多面 排序网络 非对称 问题答案 排序标准 学习 答案 语义 答案数据 传统的 组用户 构建 网站 排序 社区 网络 预测 | ||
1.一种利用非对称的多面排序网络学习解决社区问答任务的方法,其特征在于包括如下步骤:
1)针对于一组社交网络用户及其提出的问题与相关答案,构建包含用户、问题与答案之间相互关系的异质的非对称社区问答网络;
2.1)对于步骤1)形成的社区问答网络,利用单词映射网络及LSTM网络形成问题答案的映射,再结合用户映射获取反映用户问答语义映射相关性的损失值;
2.2)对于步骤1)形成的社区问答网络,利用其中含有的用户关系,与用户映射矩阵相结合,得到反映用户之间相互关系的损失项值;
2.3)利用步骤2.1)获得的反映用户问答语义映射相关性的损失值与步骤2.2)获得的反映用户之间相互关系的损失项值,得到最终的损失函数及目标函数;
3)经过训练,得到最终的多面排序标准函数,根据该函数可以对于任意问题及用户提出的答案进行排序,将更适合问题的答案排在前列。
2.根据权利要求1所述利用非对称的多面排序网络学习解决社区问答任务的方法,其特征在于所述的步骤2.1)具体为:
对于所给出的问题、答案,利用如下方法获得每个问题与答案的映射表达:首先利用预训练好的单词映射方法获得问题答案中单词的对应映射,对于问题xi的第t个单词,得到其映射为xit;之后将问题的单词映射序列{xi1,...,xin}作为LSTM的输入,将所有问题的单词全部输入之后,进行训练,将最后一层的输出作为问题的语义表达,记为qi;对于答案yi,将答案中的每一句话的所有单词的单词映射序列{yi1,...,yin}输入到LSTM网络中,将每一句话的最后一层的输出作为该句话的语义表达,之后在该答案的所有句子的语义表达输出上面增加一最大池化层,将最大池化层的输出作为该答案的语义表达,记为ai;
通过随机初始化得到用户的映射矩阵U={u1,u2,...,ul},根据步骤1)获得的异质的非对称社区问答网络,获得关于问题及相关答案和用户的限制集合R={(i,j,k,o,p)},该集合中的每一条数据(i,j,k,o,p)代表的含义为“针对于问题i而言,由用户k提出的答案j可以比由用户p提出的答案o获得更多的支持,更加符合问题的要求;”
针对于R={(i,j,k,o,p)}中的每一条数据,按照如下公式构建反映用户问答语义映射相关性的损失函数Lr:
其中,c代表提前定义好的权衡最大距离值的参数,0为与进行最大值比较防止结果小于0的限定值;代表高质量答案对应的问答对的多面排序函数,代表低质量答案对应的问答对的多面排序函数,与的计算公式如下:
其中,qi为问题i的对应映射表达,ak为答案k的对应映射表达,uj为用户j的对应映射表达,ap为答案p的对应映射表达,uo为用户o的对应映射表达,M∈Rd*d为用来计算问题与答案映射之间的语义关联程度的排序度量矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711227321.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:面向大数据的指标分类方法
- 下一篇:一种智能网页数据采集方法