[发明专利]一种基于层次化transformer的个性化商品评论摘要生成方法有效
申请号: | 202010374043.1 | 申请日: | 2020-05-06 |
公开(公告)号: | CN111680151B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 张伟;刘雪 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/33 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 陈艳娟 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 transformer 个性化 商品 评论 摘要 生成 方法 | ||
1.一种基于层次化transformer的个性化商品评论摘要生成方法,其特征在于,所述方法包括如下步骤:
步骤一:选取数据集,对数据进行预处理后切分数据为训练集、验证集和测试集;
步骤二:学习商品评论中每个单词的向量表示和位置表示,将这两者相加后作为商品评论中每个单词的表示,然后将这些表示拼接得到商品评论表示;基于相同方法得到商品摘要表示、商品历史摘要表示以及用户历史摘要表示;所述用户历史摘要表示中还包含时序表示;
步骤三:根据用户ID得到用户表示;根据商品ID得到商品表示;
步骤四:利用transformer的编码器对商品摘要表示、商品历史摘要表示以及用户历史摘要表示分别进行建模,并针对用户历史摘要表示使用用户表示指导的注意力机制来获得用户的短期表示;针对商品历史摘要表示使用商品表示指导的注意力机制获得商品的历史表示,将用户表示u、用户短期表示uH、商品表示p、商品历史表示pH以及评论表示RL进行拼接,利用另一个transformer编码器来建模这五种表示之间的相互作用,最后利用transformer解码器解码生成摘要;
所述步骤四中,利用transformer编码器对商品摘要表示、商品历史摘要表示以及用户历史摘要分别表示进行编码;用户历史摘要表示U的具体计算过程包括以下步骤:
c1.多头注意力机制:
MH(U)=MLP([H1(U);…;HM(U)]T)
c2.相加层归一化:
U′=LN(U+MH(U))
c3.前馈神经网络:
FFN(U′)=ReLU(U′W1+b1)W2+b2
c4.相加层归一化:
U1=LN(U+FFN(U′))
其中,M是多头的个数,m∈{1,...,M},MLP表示的是多层感知机,LN表示层归一化,都是模型可学习的参数;将transformer编码器堆叠L次之后可以得到用户历史摘要表示UL,同理可以得到商品评论表示RL、商品摘要表示SL和商品历史摘要表示PL;
所述步骤四中,将用户表示u、用户短期表示uH、商品表示p、商品历史表示pH以及评论表示RL进行拼接,利用另一个transformer编码器来建模这五种表示之间的相互作用,包括以下步骤:
d1.将上述5种表示进行拼接:
E=[u;uH;p;pH;RL]
其中,[;]表示向量拼接;
d2.对拼接后的表示E按照c1-c4的步骤进行计算得到E1,将transformer编码器堆叠L次之后得到EL;
步骤五:利用训练集学习模型的参数并利用验证集进行参数调优;
步骤六:利用基于层次化transformer的网络模型对测试集生成相应的商品评论摘要。
2.根据权利要求1所述的基于层次化transformer的个性化商品评论摘要生成方法,其特征在于,所述用户历史摘要是书写当前评论的用户近期所写的评论对应的摘要,即按照时间顺序由近及远选取的与当前时间间隔最短的k条评论所对应的摘要;所述商品历史摘要是当前评论所对应的商品的历史评论中与当前评论最相似的评论所对应的摘要,即依据当前评论所对应的商品的历史评论的向量表示选取与当前评论的向量表示的余弦相似度分数最高的k条评论所对应的摘要。
3.根据权利要求1所述的基于层次化transformer的个性化商品评论摘要生成方法,其特征在于,所述步骤一中,所述数据集采用的公开数据集;所述公开数据集为Amazon评论数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010374043.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于聚类分析的环境反向散射信号检测方法
- 下一篇:保洁任务推送方法及装置
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法