[发明专利]一种基于多指标评分的推荐算法在审
申请号: | 201510493550.6 | 申请日: | 2015-08-12 |
公开(公告)号: | CN105095477A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 陈健;林世杭 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 指标 评分 推荐 算法 | ||
技术领域
本发明涉及电子商务推荐系统的技术领域,尤其是指一种基于多指标评分的推荐算法。
背景技术
通过主动为用户推送其可能感兴趣的信息或者服务,推荐系统帮助用户获取更多有用信息并且节省检索时间。传统推荐系统的实现主要依赖于协同过滤技术,虽然在一定范围内取得了成功,但是协同过滤技术往往只利用单一的综合评分对用户的喜好进行刻画,综合评分只能刻画用户喜欢一个商品的程度,对用户喜欢该商品的原因却一无所知。为了对用户的喜好信息进行更加细致的刻画并提高推荐结果的准确性,新兴的推荐系统应致力于获取用户对商品不同指标的评分信息并加以利用。在这里,指标表示商品共有的属性,譬如,对于酒店,其地理位置、房间、服务等都可以用户描述该酒店优劣的指标。
随着Web2.0技术的出现与发展,越来越多的大型网站鼓励用户以多种方式与网站进行互动,这使得推荐系统获取并利用多指标评分信息成为可能。近年来,许多学者在强调多指标评分重要性的同时,也指出用户为商品撰写的评论具有重要意义,这类商品评论往往包含了大量用户对商品的评价信息,换而言之,除了由用户直接提供之外,多指标评分也可以依赖一定的评论挖掘技术由商品评论中获取。
目前,基于多指标评分的推荐系统与基于商品评论挖掘的推荐系统均取得了一定的研究成果。但是,这些研究成果很大程度上基于一个既定假设:用户对所有的商品均采取相同的指标偏好,实际上,这样的假设与我们的日常认知存在误差。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于多指标评分的推荐算法,以解决用户对于不同的商品可能具有不同的指标偏好的个性化推荐问题。
为实现上述目的,本发明所提供的技术方案为:一种基于多指标评分的推荐算法,包括以下步骤:
1)指标关键词的识别
1.1)将数据集中的每一条评论分割成句子{x1,x2,…},并且构造一个由具有表征性的关键字组成的列表;
1.2)根据原始的关键字列表,将评论语料库中的每一个句子标识至与其具有最大词频重合度的指标;
1.3)使用χ2统计指标衡量每一个指标与关键字之间的词频关系,并将前t个具有最高词频依赖关系的关键字加入该指标的关键字列表中;
1.4)重复上述过程直至算法满足终止条件,即指标的关键字列表保持不变或者算法的循环次数到达阈值;
2)意见评分抽取
在识别商品指标及其相关的特征关键字之后,对评论中的语句进行语法分析并抽取用户对指标或者特征关键字的意见;
对于每一条评论,它关于第k个指标的意见评分计算如下:
其中,s表示表述意见的形容词;OPk表示由关于第k个指标的意见形容词组成的集合;|OPk|表示集合元素的个数;score(s)表示形容词s的意见极性,即+1、-1或者0;通过这样的方式,非结构化的评论文本可以转化为一个由意见评分组成的向量Ou,i=[ou,i,1,…,ou,i,k];抽取出来的意见评分的取值范围为[-1,1],而用户直接给出的多指标评分的范围则为[1,5],为了使得两者具有相同的取值范围,采用等距离转换的方式将意见评分转换至区间[1,5]之内,具体转换公式如下:
oafter=obefore×2+3
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510493550.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种集群数据库容灾方法及装置
- 下一篇:一种新型的图像检索方法及系统