[发明专利]一种基于中文相似性计算的文章推荐方法在审
申请号: | 201810701560.8 | 申请日: | 2018-06-29 |
公开(公告)号: | CN110020189A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 孙铭鸿 | 申请(专利权)人: | 武汉掌游科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/63;G06F16/64;G06F17/27 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 430000 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于中文相似性计算的文章推荐方法,具体步骤包括:利用Python爬虫程序爬取文章的主要内容;根据爬取文章的主要内容获取词向量,并进行训练;将待推荐的文章转化为词向量矩阵;将用户关键字词组转换为矩阵,再读取上一步得到的文章转化的词向量矩阵,并对词向量矩阵数据进行标准化处理,同时进行矩阵计算,根据相似系数进行排列。本发明提供了一种基于中文相似性计算的文章推荐方法,能帮助互联网用户高效挖掘感兴趣文章、适用范围较大、人工标记成本较低、推荐多样性较好。 | ||
搜索关键词: | 矩阵 相似性计算 文章推荐 词向量 中文 读取 标准化处理 互联网用户 用户关键字 词组转换 矩阵计算 内容获取 爬虫程序 人工标记 相似系数 向量矩阵 转化 多样性 挖掘 帮助 | ||
【主权项】:
1.一种基于中文相似性计算的文章推荐方法,其特征在于,具体步骤包括:步骤1:利用Python爬虫程序爬取文章的主要内容;步骤2:根据爬取文章的主要内容获取词向量,并进行训练;步骤3:将待推荐的文章转化为词向量矩阵;步骤4:将用户关键字词组转换为矩阵,再读取步骤3得到的文章转化的词向量矩阵,并对词向量矩阵数据进行标准化处理,同时进行矩阵计算,根据相似系数进行排列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉掌游科技有限公司,未经武汉掌游科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810701560.8/,转载请声明来源钻瓜专利网。