[发明专利]一种基于地质文本语料预测目标区矿产的方法在审
申请号: | 202010430377.6 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111611404A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 朱月琴;吴永亮;谭永杰 | 申请(专利权)人: | 中国地质调查局发展研究中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/279 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 龙涛 |
地址: | 100032 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 地质 文本 语料 预测 目标 矿产 方法 | ||
1.一种基于地质文本语料预测目标区矿产的方法,其特征在于,包含以下步骤:
a.对地质文本语料进行预处理,获得实义词;
b.依据设定的高频实义词频阈值得出高频实义词;
c.对高频实义词对开展共现矩阵计算;
d.基于共现矩阵计算结果生成地质知识谱图;
e.基于地质知识图谱圈定目标区的矿产。
2.根据权利要求1所述的方法,其特征在于,所述地质文本语料预处理包含对地质文本预料的切分、去标点符号和去停用词。
3.根据权利要求1所述的方法,其特征在于,所述高频实义词阈值范围为10~100。
4.根据权利要求1所述的方法,其特征在于,所述地质知识图谱以词节点的大小和边长度的方式进行显示。
5.根据权利要求4所述的方法,其特征在于,所述词节点的大小为实义词的词频,所述边长度为实义词在地质语料中的共现频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质调查局发展研究中心,未经中国地质调查局发展研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010430377.6/1.html,转载请声明来源钻瓜专利网。