[发明专利]资讯筛选推送方法及装置有效
申请号: | 201310590508.7 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103559315B | 公开(公告)日: | 2017-01-04 |
发明(设计)人: | 张记者 | 申请(专利权)人: | 上海华勤通讯技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
代理公司: | 上海弼兴律师事务所31283 | 代理人: | 薛琦,王婧荷 |
地址: | 201203 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资讯 筛选 推送 方法 装置 | ||
1.一种资讯筛选推送方法,其特征在于,将客户端的浏览记录实时存入一浏览记录池,每条浏览记录包括主题、资讯文本、打开时间和关闭时间,该资讯筛选推送方法还包括以下步骤:
S1、计算每条浏览记录的关闭时间和打开时间的时间间隔,将该时间间隔大于预设的第一间隔的浏览记录作为第一类浏览记录,将该时间间隔小于预设的第二间隔的浏览记录作为第二类浏览记录,其中第一间隔大于第二间隔;
S2、从每条第一类浏览记录中提取主题中的词组作为第一主题关键词,并记录至一关键词数据库中;
S3、从每条第二类浏览记录中提取主题中的词组作为第二主题关键词,并记录至该关键词数据库中;
S4、获取发布时间距离当前时刻之差小于预设的第三间隔的新资讯;
S5、从新资讯中筛选出主题中包含该关键词数据库中的至少一第一主题关键词、且不包含该关键词数据库中的任何第二主题关键词的资讯作为待推送资讯;
S6、将待推送资讯发送至该客户端。
2.如权利要求1所述的资讯筛选推送方法,其特征在于,S2包括以下步骤:
S21、从每条第一类浏览记录中提取主题中的词组作为第一主题关键词,并记录至该关键词数据库中;
S22、计算各个第一主题关键词在该关键词数据库中的出现次数作为权重值,并在该关键词数据库中记录权重值;
S3包括以下步骤:
S31、从每条第二类浏览记录中提取主题中的词组作为第二主题关键词,并记录至该关键词数据库中;
S32、计算各个第二主题关键词在该关键词数据库中的出现次数的负数作为权重值,并在该关键词数据库中记录权重值;
S5由步骤S5a替代:
S5a、计算每条新资讯的主题中的所有词组在该关键词数据库中的权重值之和,并选取权重值之和相对较大的若干条新资讯作为待推送资讯。
3.如权利要求2所述的资讯筛选推送方法,其特征在于,S2还包括以下步骤:
S23、对每条第一类浏览记录中的资讯文本采用TF-IDF算法进行分词后,提取关键词作为第一文本关键词,并提取第一文本关键词的权值;
S24、取第一文本关键词和预设的一第一修正系数之积作为第一文本关键词的权重值,其中该第一修正系数大于零;
S25、在该关键词数据库中记录第一文本关键词和权重值;
S3还包括以下步骤:
S33、对每条第二类浏览记录中的资讯文本采用TF-IDF算法进行分词后,提取关键词作为第二文本关键词,并提取第二文本关键词的权值;
S34、取第二文本关键词和预设的一第二修正系数之积作为第二文本关键词的权重值,其中该第二修正系数小于零;
S35、在该关键词数据库中记录第二文本关键词和权重值。
4.如权利要求2或3所述的资讯筛选推送方法,其特征在于,S5a由S5b替代,S5b包括以下步骤:
S51b、对每条新资讯的资讯文本采用TF-IDF算法进行分词后,提取权值较高的若干资讯关键词;
S52b、计算每条新资讯的主题中的所有词组以及S51b中提取的该若干资讯关键词在该关键词数据库中的权重值之和,并选取权重值之和相对较大的若干条新资讯作为待推送资讯。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海华勤通讯技术有限公司,未经上海华勤通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310590508.7/1.html,转载请声明来源钻瓜专利网。