[发明专利]一种基于文本和图像的用户个性化偏好挖掘方法有效

专利信息
申请号: 202110265791.0 申请日: 2021-03-11
公开(公告)号: CN112925980B 公开(公告)日: 2022-08-19
发明(设计)人: 姜元春;李怡;钱洋;刘业政;孙见山;柴一栋;梁瑞成;周永行;贺菲菲;刘心语 申请(专利权)人: 合肥工业大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06Q30/06
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文本 图像 用户 个性化 偏好 挖掘 方法
【说明书】:

发明公开了一种基于文本和图像的用户个性化偏好挖掘方法,其步骤包括:1构建用户集合并提取用户购买产品信息中的产品文本描述信息及图像信息,2设计有参贝叶斯模型STILT(SparseTextandImageLinkTopic)建模偏好内容及用户的兴趣内容,3利用坍塌式吉布斯抽样算法进行参数推断。本发明能结合图片和文本的多模态数据来有效挖掘用户的个性化偏好,将用户偏好聚焦在一定范围内,从而能提高用户个性化偏好挖掘的全面性、精确性和快速性,有助于对用户进行精准推荐,并制定个性化推荐策略。

技术领域

本发明涉及用户个性化偏好挖掘技术领域,具体涉及一种基于文本和图像的用户个性化偏好挖掘方法。

背景技术

用户偏好是指用户对一种商品或商品组合的喜好程度,反映了用户个人的需要和兴趣。由于网络购物中,用户缺乏与商品的直接接触,产品的描述及图片成为用户了解产品的主要方式。这些信息直接影响用户决策,因此结合文本和图像挖掘用户个性化偏好是不可或缺的。

图片和文本已经成为网络用户购买商品时的主要信息来源,用户浏览、购买的产品信息为发掘用户个性化需求提供了丰富的资源。但目前现有技术在挖掘用户个性化偏好时,忽略了包含图片和文本的多模态数据,大多数方法只通过文本信息或只通过图片信息来挖掘用户个性化偏好,存在局限性。与此同时,现有技术忽略了用户偏好的有限性,根据注意力理论,用户不可能对所有偏好感兴趣,用户的偏好会限制在固定的范围内,因此认为用户的兴趣存在于所有的偏好显然是不合理的。

发明内容

本发明为了克服现有技术存在的不足之处,提出了一种基于文本和图像的用户个性化偏好挖掘方法,以期能结合图片和文本的多模态数据来有效挖掘用户的个性化偏好,将用户偏好聚焦在一定范围内,从而能提高用户个性化偏好挖掘的全面性、精确性和快速性,有助于对用户进行精准推荐,并制定个性化推荐策略。

本发明为达到上述发明目的,采用如下技术方案:

本发明一种基于文本和图像的用户个性化偏好挖掘方法的特点是按如下步骤进行:

步骤1、构建用户集合U={1,2,…,u,…,|U|},其中,u表示第u个用户,|U|表示用户的数量;

步骤1.1、获取|U|个用户分别购买的产品图片和产品文本描述构成用户购买产品信息集合D,其中,产品文本描述集合表示为Dw,产品图片集合表示为Dv

步骤1.2、去除所述产品文本描述集合Dw中所有标点符号、停用词、低频词,从而得到预处理后的产品文本描述集合其中,Nu表示第u个用户购买记录中所有不重复的词汇数量,Wun表示第u个用户购买记录中的第n个词汇;n=1,2,…,Nu

步骤1.3、对所述产品图片集合Dv中所有图片进行深度残差网络处理,得到预处理后的图片特征向量集合其中,Mu表示第u个用户购买记录中所有不重复的图片数量,Vum表示第u个用户购买记录中的第m个产品图片特征向量;m=1,2,…,Nu

步骤1.4、由所述预处理后的产品文本描述集合和预处理后的图片特征向量集合构成处理后的第u个用户购买产品信息Du′,从而构成处理后的|U|个用户购买产品信息集合D′;

步骤2、指定处理后的|U|个用户购买产品信息集合D′中的偏好数量为K;

步骤3、构建有参贝叶斯模型STILT,并通过分析处理后的|U|个用户购买产品信息集合D′中每个用户的产品描述文本信息和产品图片信息,挖掘用户个性化偏好;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110265791.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top