[发明专利]一种自动实时新闻推荐方法在审
申请号: | 201710345567.6 | 申请日: | 2017-05-17 |
公开(公告)号: | CN107025310A | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 庞景秋;齐景春;崔放;于希丰;刘杨;张少卓;毛成岳 | 申请(专利权)人: | 长春嘉诚信息技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 长春吉大专利代理有限责任公司22201 | 代理人: | 杜森垚 |
地址: | 130103 吉林省长*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种自动实时新闻推荐方法,包括以下步骤新闻抓取,新闻预处理,新闻模型训练,新闻特征建模,用户特征初步建模,用户特征二次建模,基于新闻特征模型和用户兴趣模型的融合匹配度计算,并基于融合匹配度计算结果进行个性化新闻推荐。本发明能对新闻进行自动、实时的个性化推荐,无论是新用户和已注册用户,都具有很强的适应性和稳定性。 | ||
搜索关键词: | 一种 自动 实时 新闻 推荐 方法 | ||
【主权项】:
一种自动实时新闻推荐方法,其特征在于,包括以下步骤:步骤一、新闻抓取:通过爬虫工具,抓取新闻网页地址,下载新闻标题及新闻内容,并将新闻存储到数据库新闻表中;步骤二、新闻预处理:对新闻进行分词处理,只保留名词;去掉无效新闻,并将有效新闻的分词结果存储到数据库新闻表中;步骤三、新闻模型训练:采用基于Gibbs Sampling的LDA算法进行主题模型的训练,建立主题模型;步骤四、新闻特征建模:进行新闻特征提取,建立新闻特征模型,新闻特征模型由新闻标签模型Nt和新闻主题特征模型Nl组成,即N={Nt,Nl};步骤五、用户特征初步建模:进行用户特征提取,建立用户画像,对用户特征进行初步建模;步骤六、用户特征二次建模:基于步骤五用户特征初步建模结果,对用户特征进行二次精确建模,建立用户兴趣模型U;用户兴趣模型U由用户兴趣关键词模型Ut和用户兴趣主题特征模型Ul组成,即U={Ut,Ul};步骤七、相似度计算:基于上述步骤四至步骤六提取的新闻特征和用户特征,进行新闻特征模型和用户兴趣模型的融合匹配度计算;步骤八、新闻推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春嘉诚信息技术股份有限公司,未经长春嘉诚信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710345567.6/,转载请声明来源钻瓜专利网。