[发明专利]一种基于标签语义规范化推荐方法有效
申请号: | 201610972494.9 | 申请日: | 2016-11-04 |
公开(公告)号: | CN106599037B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 叶婷;曹杰;姚瑞波;崔莹;伍之昂;申冬琴 | 申请(专利权)人: | 焦点科技股份有限公司;南京财经大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 210061 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 语义 规范化 推荐 方法 | ||
1.一种基于标签语义规范化推荐方法,其特征在于,包括以下步骤:
对用户自定义的标签进行预处理,获得预处理后的标签;
基于所述预处理后的标签利用Word2Vec训练模型获得标签中的所有词的词向量,根据所述词向量计算得到标签语义相似度;
根据所述预处理后的标签获得标签资源矩阵,以及利用标签资源矩阵计算得到标签资源共现相似度;所述标签资源共现相似度的计算公式为:其中,对于标签a,令N(a)为有标签a的物品集合,na,i为物品i打上标签a的用户数,余弦现相似度公式计算标签a和标签b的资源共现相似度;
根据所述标签语义相似度和所述标签资源共现相似度计算得到线性融合相似度;所述根据所述标签语义相似度和所述标签资源共现相似度计算得到线性融合相似度的计算公式为:其中,λ为调节权因子;
根据线性融合相似度构建标签融合度矩阵,依据所述标签融合度矩阵获得标签的预设值K个类簇;根据所述标签的预设值K个类簇进行聚类收敛条件的判断,若满足其中任意一项条件即可获得新的用户规范化标签;
结合所述用户语义规范化后的标签数据进行协同过滤推荐。
2.根据权利要求1所述的方法,其特征在于,根据所述标签的预设值K个类簇进行聚类收敛条件的判断,若不满足其中任意一项条件即执行所述线性融合相似度构建标签融合度矩阵的步骤。
3.根据权利要求1-2所述的方法,其特征在于,所述聚类收敛条件包括:
没有数据点被重新分配给不同的类,或者新的聚类中心与原类聚中心相同。
4.根据权利要求1所述的方法,其特征在于,所述根据所述线性融合相似度获得用户语义规范化后的标签数据,结合所述用户语义规范化后的标签数据进行协同过滤推荐的步骤包括:
利用所述用户语义规范化后的标签数据构建用户兴趣模型,并使用TagBasedTF-IDF算法计算出所述用户语义规范化后的标签数据兴趣项t的兴趣度;
根据所述用户语义规范化后的标签数据兴趣项t的兴趣度和协同过滤算法对用户进行推荐。
5.根据权利要求1所述的方法,其特征在于,所述根据所述词向量计算得到所述标签语义相似度的步骤中所述的计算公式如下:
其中,所述表示标签a,b的词向量表示,在语义空间模型中,两个词向量的余弦距离即表示为它们的语义相似度。
6.根据权利要求5所述的方法,其特征在于,所述用户兴趣模型是根据向量空间模型VSM构建用户的规范语义标签兴趣模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司;南京财经大学,未经焦点科技股份有限公司;南京财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610972494.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于服务器集群的并行实时数据库
- 下一篇:面向电力应用的可视化统计发布系统