[发明专利]用户关注点识别方法、系统和存储介质有效
申请号: | 202010430540.9 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111798262B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 刘业政;陶守正;姜元春;孙见山;钱洋;井二康;周永行;梁瑞成;魏学梅;田志强 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/289;G06F40/30 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 关注点 识别 方法 系统 存储 介质 | ||
1.一种用户关注点识别方法,其特征在于,所述识别方法由计算机执行,包括以下步骤:
获取用户评价数据,形成历史数据;所述历史数据包括:用户对车型每一维度的历史评论数据、用户对车型每一维度的历史评分数据、用户对车型的历史总评分数据和用户购车目标数据;
基于所述历史评论数据获取用户对车型每一维度的评论隐向量;
基于所述历史评分数据和所述评论隐向量获取用户对车型每一维度的感知隐向量;
基于所述用户购车目标数据和所述感知隐向量获取用户对车型每一维度的注意力得分;
基于所述感知隐向量和所述注意力得分获取用户对车型的总体感知向量;基于所述总体感知向量构建评分预测模型;
基于所述评分预测模型获取用户对车型的预测评分;基于所述预测评分和所述历史总评分数据优化所述评分预测模型;
将用户对目标车型每一维度的评论数据、评分数据和用户对目标车型的购车目标数据输入优化后的评分预测模型,得到用户对目标车型每一维度的关注度分布;
所述用户对车型每一维度的注意力得分的获取方法包括:
预先构建加性注意力模型,具体为:
s(pi,q)=VTtanh(Wppi+Wqq)
其中:
s(pi,q)为注意力打分函数;
V、Wp和Wq为网络参数;
pi为用户对车型第i个维度的感知隐向量,i=1,2,...,n;
q为表示用户购车目标的one-hot向量;
将所述用户购车目标数据和所述感知隐向量输入到所述加性注意力模型中,基于softmax归一化方法求得注意力得分,所述注意力得分具体为:
其中:
αi为用户对车型第i个维度的注意力分布;
V、Wp和Wq均为待学习的参数,采用[-1,1]的均匀分布进行初始化;
基于加权平均聚合策略,处理所述每一维度的感知隐向量和所述每一维度的注意力得分,得到用户对车型的总体感知向量;所述总体感知向量具体为:
其中:
p为用户对车型的总体感知向量;
基于softmax函数和全连接层处理所述总体感知向量,得到评分预测模型,具体为:
其中:
表示用户对车型的总评分为t的预测概率;
c为批样本量;
所述评分预测模型的优化方法包括:
基于所述历史总评分数据和所述预测评分计算交叉熵损失函数,所述交叉熵损失函数为:
其中:
y为用户对目标车型的总评分;
为模型预测的用户对目标车型的总评分;
kt表示用户对目标车型的总评分为类别t的概率;
以256条样本为一个训练批次,迭代优化模型,直至连续的10个批次损失值误差不超过预设的阈值。
2.如权利要求1所述的识别方法,其特征在于,所述用户对车型每一维度的评论隐向量的获取方法包括:
对所述历史评论数据进行预处理,包括:分词处理,去除停用词和特殊字符;
基于word2vec算法计算预处理后的评论数据,得到每个词语的隐向量;
对所有词语的隐向量的求平均,得到用户对车型每一维度的评论隐向量。
3.如权利要求1所述的识别方法,其特征在于,所述用户对目标车型每一维度的关注度分布的获取方法包括:
其中:
αi为用户对目标车型第i个维度的注意力得分,用于表示用户的关注度分布;
和均为训练好的模型参数;
表示用户对目标车型第i个维度的感知隐向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010430540.9/1.html,转载请声明来源钻瓜专利网。