[发明专利]一种用户偏好分析方法及其装置在审
申请号: | 201810441397.6 | 申请日: | 2018-05-10 |
公开(公告)号: | CN108647312A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 马云峰;郭秀;黄文官;梁绍钧 | 申请(专利权)人: | 佛山欧神诺云商科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 王国标 |
地址: | 528000 广东省佛山市禅城*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户历史数据 偏好信息 用户偏好分析 个性化产品 产品信息 推荐服务 偏好度 特征词 偏好 过滤 用户历史访问记录 用户行为数据 个性化需求 案例信息 匹配产品 日志文件 信息推送 用户推荐 用户行为 真正用户 整体产品 数据库 分析 采集 挖掘 | ||
1.一种用户偏好分析方法,其特征在于,所述方法包括:
步骤1,提取产品与案例信息的特征词;
步骤2,通过日志文件和数据库采集用户历史数据;
步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;
步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;
步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;
步骤6,向用户推送用户的偏好信息;
其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型。
2.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤1中,所述提取产品与案例信息的特征词的方法包括以下子步骤:
步骤1.1,将所述产品与案例的文本分词,获得分类词;
步骤1.2,遍历所有分类词并统计每个分类词次数;
步骤1.3,选取分类词次数大于或等于次数阈值的分类词作为特征词;
其中,次数阈值为5次。
3.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤2中,所述采集用户历史数据的方法包括以下子步骤:
步骤2.1,采集日志文件中的用户访问关键词;
步骤2.2,读取SQL数据库内的用户访问类型记录;
步骤2.3,合并用户访问关键词和用户访问记录得到用户历史数据。
4.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤3中,非真正用户数据包括非注册用户访问数据、临时用户数据和已注销用户数据。
5.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤4中,所述计算出整体产品与案例的偏好度的方法为:其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10。
6.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤5中,所述根据偏好度匹配产品与案例的特征词获取偏好信息方法为:
步骤5.1,根据特征词与用户对产品与案例信息的访问次数设置类别阈值;
步骤5.2,当偏好度大于等于类别阈值时读取特征值所对应的产品与案例偏好信息;
其中,类别阈值为用户对产品与案例信息的访问次数/权重值,其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10。
7.一种用户偏好分析装置,其特征在于,所述装置包括:
特征词提取单元,用于提取产品与案例信息的特征词;
历史数据采集单元,用于通过日志文件和数据库采集用户历史数据;
历史数据过滤单元,用于过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;
偏好度计算单元,用于使用过滤后的用户历史数据计算出整体产品与案例的偏好度;
偏好信息获取单元,用于根据偏好度匹配产品与案例的特征词获取偏好信息;
偏好信息推送单元,用于向用户推送用户的偏好信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山欧神诺云商科技有限公司,未经佛山欧神诺云商科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810441397.6/1.html,转载请声明来源钻瓜专利网。