[发明专利]服务器存储新闻的存储资源优化方法及系统在审
申请号: | 201910593949.X | 申请日: | 2019-07-03 |
公开(公告)号: | CN110413899A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 马文佳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/958;G06F16/33 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 葛勤 |
地址: | 518029 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种服务器存储新闻的存储资源优化方法及系统,涉及服务器资源优化技术领域,用于优化服务器的存储资源,包括:对新闻数据分类,并将获取的新闻数据格式化;将格式化新闻进行分词标注处理生成新闻处理数据;对标注的动词及名词敏感性分析生成分析结果;若分析结果中有敏感性词汇,将新闻处理数据对应的新闻数据过滤并删除;若分析结果不具有敏感性词汇,提取新闻处理数据中标注的动词及名词生成提取数据;根据提取数据生成新闻主题;对新闻主题中概率最大的主题求和;若求和结果大于或等于阈值,保留新闻主题对应的新闻数据,若求和结果小于阈值,删除新闻主题对应的新闻数据;从而提高了新闻提供商的服务器调用有价值的新闻的效率。 | ||
搜索关键词: | 新闻数据 新闻主题 处理数据 标注 存储资源优化 格式化 服务器存储 求和结果 提取数据 删除 词汇 服务器调用 服务器资源 敏感性分析 优化服务器 存储资源 提供商 求和 分词 过滤 分类 概率 保留 优化 | ||
【主权项】:
1.一种服务器存储新闻的存储资源优化方法,其特征在于,包括:对新闻数据进行分类,生成新闻类别,并将获取的新闻数据进行格式化,生成格式化新闻;在所述新闻类别下,将所述格式化新闻进行分词标注处理,生成新闻处理数据;对所述新闻处理数据中标注的动词及名词进行敏感性分析,生成分析结果;判断所述分析结果,若所述分析结果表明所述新闻处理数据中具有敏感性词汇,则将新闻处理数据对应的新闻数据过滤并删除;若所述分析结果表明所述新闻处理数据中不具有敏感性词汇,则提取所述新闻处理数据中标注的动词及名词,生成提取数据;根据所述提取数据生成至少一个新闻主题;对所有所述新闻主题中概率最大的主题进行求和,得到求和结果;将所述求和结果与预先设定的阈值对比,若所述求和结果大于或等于所述阈值,则保留所述新闻主题对应的新闻数据,若所述求和结果小于所述阈值,则删除所述新闻主题对应的新闻数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910593949.X/,转载请声明来源钻瓜专利网。
- 上一篇:社交网络中的推荐方法及设备
- 下一篇:基于维特比算法的多社交网络账号匹配方法