[发明专利]一种遥感卫星资讯推荐方法、系统及设备在审
申请号: | 202211216697.7 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115640458A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 玉龙飞雪;万伟;王冠珠;唐珂;黄涛;王浩天;刘国栋;乔亦实;闫大鹏;李辉 | 申请(专利权)人: | 中国四维测绘技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06F40/289;G06F40/30;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 庞静 |
地址: | 100048 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 遥感 卫星 资讯 推荐 方法 系统 设备 | ||
1.一种遥感卫星资讯推荐方法,其特征在于包括:
采集卫星资讯文本并进行初步处理,将资讯文本组织为预设的数据存储结构并存储;
对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯;
利用上述带有标签及置信度的卫星资讯,构建卫星知识图谱;
根据用户的查询内容,对上述存储的卫星资讯进行初步召回;
基于构建的卫星知识图谱,挖掘上述召回资讯结果的关联资讯,作为推荐候选资讯集;
对上述推荐候选资讯集中的候选资讯进行相关性评测,根据评测结果进行最终推荐。
2.根据权利要求1所述的方法,其特征在于:所述初步处理包括:
从新闻网站、遥感卫星运营商官网以及各国航天政府机构网站进行多线程爬取,获取卫星资讯的原始文本信息;
选择检索引擎作为卫星资讯的存储组件;
通过抽取、转换清洗、加载流程对原始文本信息进行处理,将资讯文本组织为预设的数据存储结构并存储至上述检索引擎。
3.根据权利要求2所述的方法,其特征在于:所述的检索引擎选择ES全文检索引擎,全文检索引擎以集群的方式进行部署。
4.根据权利要求1所述的方法,其特征在于:得到带有标签及置信度的卫星资讯包括:
提取检索引擎中遥感卫星领域的关键词作为标签,形成卫星资讯标签库;
设计可配置的智能标签匹配模型,所述匹配模型概括不同特征的标签对资讯文本的匹配逻辑,并能计算得到标签于资讯文本的匹配置信度;
利用所述智能标签匹配模型对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯。
5.根据权利要求4所述的方法,其特征在于:所述可配置的智能标签匹配模型包括标签匹配策略、标签匹配模式、结果置信度计算模式三部分;
所述的标签匹配策略中存储预先设计的多个匹配策略;
所述标签匹配模式用于根据需求从标签匹配策略中选择不同的匹配策略组成单策略模式或组合匹配模式;
所述结果置信度计算模式中存储不同的置信度计算模式。
6.根据权利要求5所述的方法,其特征在于:所述匹配策略包括正则标签匹配策略、文本相似度标签匹配策略、深度学习标签匹配策略;
所述正则标签匹配策略适用于遥感卫星领域的专业词组或固定表达构成的标签匹配;
所述文本相似度标签匹配策略用于使用资讯与标准表述的文本相似度来判断是否满足标签匹配,所述标准为参考标准,是标签特征设计的概括性表述;
所述深度学习标签匹配策略以资讯文本作为输入,标签匹配得分作为输出进行网络训练;网络输出的得分超过设置的阈值,则认为标签匹配,得分作为置信度。
7.根据权利要求5所述的方法,其特征在于:通过最大通用性的表设计方式,将智能标签匹配模型的配置方式存放在MySQL数据库中,保证智能标签匹配模型的开闭原则,使匹配策略能够进行灵活快速地迭代。
8.根据权利要求7所述的方法,其特征在于:最大通用型的表设计内容包括:
设计验证阶段:卫星资讯文本数量小于500,匹配策略和标签匹配模式为:正则匹配策略或文本相似度匹配策略的单策略模式;结果置信度计算模式为直接使用单一策略的置信度结果作为模型的最终置信度结果;
开发实施阶段:卫星资讯文本数量500-2000,匹配策略和标签匹配模式为:正则匹配+深度学习标签匹配策略;或者文本相似度+深度学习标签匹配策略的组合策略模式;结果置信度计算模式为求取不同策略置信度结果的平均值作为模型的最终置信度结果;
试运行阶段:卫星资讯文本数量2000-5000时,匹配策略和标签匹配模式为:正则匹配+深度学习标签匹配策略;或者文本相似度+深度学习标签匹配策略的组合策略模式;结果置信度计算模式为求取不同策略置信度结果的加权平均值作为模型的最终置信度结果;
运行阶段:卫星资讯文本数量大于5000时,匹配策略和标签匹配模式为:深度学习标签匹配策略的单策略模式,结果置信度计算模式为直接使用单一策略的置信度结果作为模型的最终置信度结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国四维测绘技术有限公司,未经中国四维测绘技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211216697.7/1.html,转载请声明来源钻瓜专利网。