[发明专利]服务器存储新闻的存储资源优化方法及系统在审
申请号: | 201910593949.X | 申请日: | 2019-07-03 |
公开(公告)号: | CN110413899A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 马文佳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/958;G06F16/33 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 葛勤 |
地址: | 518029 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻数据 新闻主题 处理数据 标注 存储资源优化 格式化 服务器存储 求和结果 提取数据 删除 词汇 服务器调用 服务器资源 敏感性分析 优化服务器 存储资源 提供商 求和 分词 过滤 分类 概率 保留 优化 | ||
1.一种服务器存储新闻的存储资源优化方法,其特征在于,包括:
对新闻数据进行分类,生成新闻类别,并将获取的新闻数据进行格式化,生成格式化新闻;
在所述新闻类别下,将所述格式化新闻进行分词标注处理,生成新闻处理数据;
对所述新闻处理数据中标注的动词及名词进行敏感性分析,生成分析结果;
判断所述分析结果,若所述分析结果表明所述新闻处理数据中具有敏感性词汇,则将新闻处理数据对应的新闻数据过滤并删除;
若所述分析结果表明所述新闻处理数据中不具有敏感性词汇,则提取所述新闻处理数据中标注的动词及名词,生成提取数据;
根据所述提取数据生成至少一个新闻主题;
对所有所述新闻主题中概率最大的主题进行求和,得到求和结果;
将所述求和结果与预先设定的阈值对比,若所述求和结果大于或等于所述阈值,则保留所述新闻主题对应的新闻数据,若所述求和结果小于所述阈值,则删除所述新闻主题对应的新闻数据。
2.根据权利要求1所述的服务器存储新闻的存储资源优化方法,其特征在于,所述方法还包括:对新闻数据进行排序;
所述对新闻数据进行排序包括:
获取新闻数据的新闻信息,所述新闻信息包括新闻时间、信息源、相似新闻数量及热度词;
根据所述新闻信息对新闻数据的价值进行评估,生成新闻数据的评估数值;
根据所述评估数值的大小,根据从大到小的顺序为新闻数据进行排序。
3.根据权利要求2所述的服务器存储新闻的存储资源优化方法,其特征在于,所述对新闻数据进行排序还包括:
设置三个阶段数值,根据所述阶段数值的范围将所述评估数值分为评估数值高、评估数值中及评估数值低三个阶段;
将三个阶段数值范围内对应的新闻数据按照范围不同分别存储至服务器的不同区域内。
4.根据权利要求3所述的服务器存储新闻的存储资源优化方法,其特征在于,所述方法还包括:
根据所述三个阶段数值内的数值调用对应的新闻数据,且优先调用所述评估数值高的范围内的新闻数据,将调用的新闻数据输出并推送至用户处。
5.根据权利要求3所述的服务器存储新闻的存储资源优化方法,其特征在于,所述方法还包括:
获取并记录用户点击新闻数据对应的所述三个阶段数值内的点击频率;
优先调用用户点击所述三个阶段数值内的新闻数据点击频率最高的新闻数据为用户推送新闻数据。
6.根据权利要求5所述的服务器存储新闻的存储资源优化方法,其特征在于,所述方法还包括:
根据所述点击频率计算用户在所述三个阶段数值内点击新闻数据的点击比率;
根据所述点击比率从服务器内调用与所述点击比率相同比率的新闻数据推送至用户处。
7.根据权利要求1所述的服务器存储新闻的存储资源优化方法,其特征在于,所述方法还包括:
获取新闻数据的时间信息;
根据所述时间信息将所有新闻数据分为第一时间段新闻、第二时间段新闻、第三时间段新闻及第四时间段新闻,所述第一时间段新闻为当天新闻数据,所述第二时间段新闻为当天至三天内的新闻数据,所述第三时间段新闻为三天至一周内的新闻数据,所述第四时间段新闻为一周外的新闻数据;
记录用户点击不同时间段新闻的时间比率;
根据所述时间比率从服务器内调用相同比率的第一时间段新闻、第二时间段新闻、第三时间段新闻及第四时间段新闻推送至用户处。
8.根据权利要求7所述的服务器存储新闻的存储资源优化方法,其特征在于,所述方法还包括:
采集用户在一天内的不同时间点击新闻数据的所述时间比率,生成分时比率;
根据所述分时比率在一天内的不同时间段调用服务器内的新闻数据推送至用户处。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910593949.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:社交网络中的推荐方法及设备
- 下一篇:基于维特比算法的多社交网络账号匹配方法