[发明专利]一种个性化情感摘要的计算方法与装置有效
申请号: | 201811568554.6 | 申请日: | 2018-12-21 |
公开(公告)号: | CN109800390B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 张世博;沙芸;杨飞 | 申请(专利权)人: | 北京石油化工学院 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/258 |
代理公司: | 北京远立知识产权代理事务所(普通合伙) 11502 | 代理人: | 李海燕 |
地址: | 102600 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 情感 摘要 计算方法 装置 | ||
1.一种个性化情感摘要的计算方法,其特征在于,包括:
基于用户评论数据信息构建数据集;
基于预设要素信息对所述数据集进行过滤,得到过滤结果;
通过用户敏感编码器,对所述过滤结果使用双向LSTM进行编码后,基于用户选择机制从所述过滤结果中,获取用户关注度高的评论内容进行建模,得到建模结果;
通过用户敏感解码器对所述建模结果进行解码,并输入用户向量及用户词汇至所述解码器的词汇预测阶段,使得所述解码器输出个性化情感摘要;
其中,所述通过用户敏感编码器,对所述过滤结果使用双向LSTM进行编码后,基于用户选择机制从所述过滤结果中,获取用户关注度高的评论内容进行建模,得到建模结果包括:
基于用户选择机制的网络输入是用户向量u和编码端的隐层状态,输出是通过一个门向量gatei进行过滤后得到的源端隐层向量:
(1)
(2)
其中和是选择机制的参数,[;]是连接符号,σ表示的是 sigmoid活函数,并且指的是逐位相乘的操作,指的是保留信息的量,称为源端隐层向量;
其中,所述通过用户敏感解码器对所述建模结果进行解码,并输入用户向量及用户词汇至所述解码器的词汇预测阶段,使得所述解码器输出个性化情感摘要包括:
在 t 时刻的解码过程中,解码器通过接受上一时刻解码出的词向量生成 t 时刻的解码状态,然后用所述解码状态去关注所述源端隐层向量,得到 t 时刻的上下文向量,具体计算公式如(3)(4)(5)所示:
(3)
(4)
(5)
其中,W
将用户关注词汇表融入到词汇预测模块,得到影响词汇的概率分布
(6)
(7)
(8)
其中,W
将和用户向量u融入读出状态中,并得到式(9)及(10):
(9)
(10)
其中,,,和bo是模型参数;为将和用户向量u融入读出状态之后得到的;为利用新的更新过的 t 时刻生成词汇的概率。
3.根据权利要求1所述的计算方法,其特征在于,所述基于预设要素信息对所述数据集进行过滤,得到过滤结果包括:
基于目标网站定义所述预设要素信息;
根据要素分割算法将所述预设要素信息自动拓展种子词;
基于所述预设要素信息及所述种子词对所述数据集进行第一次过滤,得到第一次过滤结果;
对所述第一次过滤结果进行长度过滤,过滤掉题目词汇小于预设数量的用户评论数据信息,得到第二次过滤结果;
对所述第二次过滤结果进行压缩比过滤,过滤掉评论长度与题目长度比值大于预设阈值的所述用户评论数据信息,得到所述过滤结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京石油化工学院,未经北京石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811568554.6/1.html,转载请声明来源钻瓜专利网。