[发明专利]用户关注点识别方法、系统和存储介质有效
申请号: | 202010430540.9 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111798262B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 刘业政;陶守正;姜元春;孙见山;钱洋;井二康;周永行;梁瑞成;魏学梅;田志强 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/289;G06F40/30 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 关注点 识别 方法 系统 存储 介质 | ||
本发明提供一种用户关注点识别方法、系统和存储介质,涉及数据处理领域。包括以下步骤:获取用户对车型每一维度的历史评论数据、历史评分数据、历史总评分数据和用户购车目标数据;基于历史评论数据获取评论隐向量;基于历史评分数据和评论隐向量获取感知隐向量;基于用户购车目标数据和感知隐向量获取注意力得分;基于感知隐向量和注意力得分获取总体感知向量;基于总体感知向量构建评分预测模型;基于评分预测模型获取用户对车型的预测评分;基于预测评分和历史总评分数据优化评分预测模型;基于优化后的评分预测模型得到用户对目标车型每一维度的关注度分布。本发明可以准确识别用户的关注点。
技术领域
本发明涉及数据处理技术领域,具体涉及一种用户关注点识别方法、系统和存储介质。
背景技术
随着互联网等信息技术的飞速发展和智能终端设备的普及,人们越来越多地在线上论坛与朋友分享兴趣、讨论时事,众多领域的商家诸如汽车领域,也会主动建立论坛吸引用户以增加客户的归属感、帮助改善产品或服务。众多的在线论坛每天都会产生大量数据,如何从海量的论坛数据中挖掘出用户对某款具体产品的关注点以成为工业界和学术界共同关注的研究热点。
传统的用户关注点识别方法主要基于汽车论坛用户发布的文本或数值型数据,采用基础的自然语言处理技术或统计方法构建多阶段用户关注点识别模型,继而通过模型预测用户的关注点。
然而本申请的发明人发现,现有技术在分析用户对于某一产品的关注点时,考虑的层面较少,忽略了用户本身意愿的层面,导致现有技术的分析结果不够准确。即现有技术在识别用户关注点时存在准确性低的缺点。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种用户关注点识别方法、系统和存储介质,解决了现有技术准确性低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明解决其技术问题所提供的一种用户关注点识别方法,所述识别方法由计算机执行,包括以下步骤:
获取用户评价数据,形成历史数据;所述历史数据包括:用户对车型每一维度的历史评论数据、用户对车型每一维度的历史评分数据、用户对车型的历史总评分数据和用户购车目标数据;
基于所述历史评论数据获取用户对车型每一维度的评论隐向量;
基于所述历史评分数据和所述评论隐向量获取用户对车型每一维度的感知隐向量;
基于所述用户购车目标数据和所述感知隐向量获取用户对车型每一维度的注意力得分;
基于所述感知隐向量和所述注意力得分获取用户对车型的总体感知向量;基于所述总体感知向量构建评分预测模型;
基于所述评分预测模型获取用户对车型的预测评分;基于所述预测评分和所述历史总评分数据优化所述评分预测模型;
将用户对目标车型每一维度的的评论数据、评分数据和用户对目标车型的购车目标数据输入优化后的评分预测模型,得到用户对目标车型每一维度的关注度分布。
优选的,所述用户对车型每一维度的评论隐向量的获取方法包括:
对所述历史评论数据进行预处理,包括:分词处理,去除停用词和特殊字符;
基于word2vec算法计算预处理后的评论数据,得到每个词语的隐向量;
对所有词语的隐向量的求平均,得到用户对车型每一维度的评论隐向量。
优选的,所述用户对车型每一维度的注意力得分的获取方法包括:
预先构建加性注意力模型,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010430540.9/2.html,转载请声明来源钻瓜专利网。