[发明专利]一种文档关键词提取及基于文档匹配商品的方法在审

申请号：	201910553323.6	申请日：	2019-06-25
公开（公告）号：	CN110287289A	公开（公告）日：	2019-09-27
发明（设计）人：	周楠;徐翔	申请（专利权）人：	北京金海群英网络信息技术有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/335;G06Q30/06
代理公司：	北京市盈科律师事务所 11344	代理人：	李兆岭
地址：	北京市海淀区学清路8号（***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种文档关键词提取及基于文档匹配商品的方法。目标文档关键词提取方法包括：利用TextRank技术，获得目标文档中m个词的权重；在m个初始关键词中，选择权重靠前的n个词作为初始关键词；基于预定的策略，分别确定目标文档中j个词的预定IDF值；利用TF‑IDF，分别确定目标文档中j个词在目标文档中的TF值；基于预定IDF值和TF值，利用TF‑IDF技术确定j个词的TF‑IDF权重；在j个词中，选择权重靠前的k个词作为校验关键词；判断各初始关键词是否属于校验关键词，如果为是，则将该初始关键词作为文档关键词。
搜索关键词：	目标文档文档关键词校验选择权权重文档匹配关键词提取
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种目标文档关键词提取方法，其特征在于，包括如下步骤：S210，利用TextRank技术，获得目标文档中m个词的权重；S220，在m个初始关键词中，选择权重靠前的n个词作为初始关键词，其中，n≦m；S230，基于预定的策略，分别确定目标文档中j个词的预定IDF值；S240，利用TF‑IDF，分别确定目标文档中j个词在目标文档中的TF值；S250，基于预定IDF值和TF值，利用TF‑IDF技术确定j个词的TF‑IDF权重；S260，在j个词中，选择权重靠前的k个词作为校验关键词；其中，k≦j；S270，判断各初始关键词是否属于校验关键词，如果为是，则将该初始关键词作为文档关键词，并输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京金海群英网络信息技术有限公司，未经北京金海群英网络信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910553323.6/，转载请声明来源钻瓜专利网。

上一篇：推荐文档的方法和装置
下一篇：基于阅读理解的营销线索提取方法、装置及计算机可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文档关键词提取及基于文档匹配商品的方法在审

专利文献下载