[发明专利]一种在神经网络下结合人格特征的跨域推荐方法有效
申请号: | 201811584347.X | 申请日: | 2018-12-24 |
公开(公告)号: | CN109766493B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 曲立平;刘云鹏 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 结合 人格 特征 推荐 方法 | ||
1.一种在神经网络下结合人格特征的跨域推荐方法,具体步骤如下:
(1)获取数据;由于微博的授权认证是需要加密的,也就是需要身份认证的,虽然用户不会向微博透露自身的用户名以及密码,但是微博需要确认第三方的身份并提供特定的用户资源访问授权;新浪微博的授权方式是通过OAUTH认证实现的,它提供了一个稳定而安全的认证授权环境;授权完毕后,API根据用户发送的不同请求,会返回特定的文件,通过对相关文件的解析,便可以获得原始数据资源,其中包括用户自己发布的微博、他的粉丝、他的点赞、他的转发;
(2)筛选用户;由于微博用户中的数据可能存在包括小号、滞销号的无用号,所以需要提取对实验有意义的数据,就需要进行有效用户数据筛选,因此建立一个基于活跃度和影响力的微博用户权重模型;我们利用HITS算法,将用户的微博内容类比成一个网页进行解析,粉丝数量,粉丝互动值是影响力,发布数量和时间是活跃度,作为指标建立矩阵,然后迭代收敛,选取符合阈值条件的用户;
(3)提取关键词:利用TF-IDF算法获取并计算数据的词条权重,也就是采集关键词词频,关键词词频对于个性化推荐的匹配度是重要的指标,这些关键词词频会用于搭建神经网络;TF-IDF实际上是:TF*IDF;主要思想是:如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类;
(4)搭建神经网络;当得到人格特征和用户在音乐和食品方面相关的关键词数据后,就需要构建一个神经网络,本文是利用卷积神经网络将人格特征神经网络化,也就是说其中最重要的算法是卷积算法,我们构建的神经网络也是由很多个卷积构成的,构建过程其实也就是数据的训练过程;
(5)针对人格特征,给具有相似人格特征的人进行个性化物品推荐;
构建的神经网络也是由很多个卷积构成的,构建过程其实也就是数据的训练过程;具体分为三层:
(4.1)输入层就是将用户数据提取出来的关键词输入;
(4.2)隐含层是重点,把所提取的这些数据带入卷积公式得到具备此类人格特征的用户和这类具备这些关键词的音乐/食品的权重值,权重值就是表示关联度的大小,反复卷积就是下一个用户是在前一个的基础上进行卷积,也就是经过很多次之后得到一个相互关联的神经网,加上偏置和激活函数,如果输出不是最后一层就是继续卷积加权;
(4.3)输出层:直至输出是最后一层,就可以经过前面的计算得到权重值相对较高的输出结果,也就是我们要推荐的最符合的内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811584347.X/1.html,转载请声明来源钻瓜专利网。