[发明专利]一种基于互联网的知识相关度智能提取方法在审
申请号: | 201610982515.5 | 申请日: | 2016-11-09 |
公开(公告)号: | CN106484918A | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 杨存耿;谢术清;杨晓强 | 申请(专利权)人: | 天津赛因哲信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300000 天津市滨海新区滨海高新区华苑*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于互联网的知识相关度智能提取方法包括以下步骤步骤1文本数据库的建立;步骤2分词处理;步骤3知识相关度计算;步骤4聚类;步骤5三个层次的智能数字化文献库的建立;步骤6数据服务器的存储。本发明利用已有知识进行,在分词技术上进行了创新,通过计算智能技术中的相关度的计算,进行相关推理和发现,如事件相关性、地域相关性等,进而进行聚类、建立文献库、存储至数据服务器,通过机器学习数据分析与挖掘手段,可以得到更深入的内涵。 | ||
搜索关键词: | 一种 基于 互联网 知识 相关 智能 提取 方法 | ||
【主权项】:
一种基于互联网的知识相关度智能提取方法,其特征在于:所述一种基于互联网的知识相关度智能提取方法,包括以下步骤:步骤1:文本数据库的建立:文本数据库的文本内容由存储网络资源数据库与自主收集数据库组成;步骤2:分词处理:对文本数据库中的文本内容采用逆向最大匹配法、基于词的频度统计的分词方法和基于知识理解的分词方法进行分词处理,建立以词为单位的数字化古籍档案库;步骤3:知识相关度计算:设一级知识元本体为Kq,二级知识元本体为Ks,则Kq和Ks的知识相关度表示为相似度与相关性扩展的比例关系:Relevance(Kq,Ks)=ReleR(Kq,Ks)*Sim(Kq,Ks)知识元本体的相似性表示为:Relevance(Kq,Ks)=Sim(Kq,Ks)*(a+b*ReleR(Kq,Ks))其中a+b=1,a和b的值可以调节;步骤4:聚类:根据所处理的知识元本体的一些属性特征,对一些知识元本体进行分类,经过分类以后的知识元本体,在某一类内部,其知识元本体之间的相关度计算数值很大;步骤5:三个层次的智能数字化文献库的建立:根据相关度计算数值对数字化古籍档案库进行智能化文献整理,建立三个层次的智能数字化文献库,所述三个层次的智能数字化文献库包括原始数据化文献库、关系索引文献库、逻辑学习文献库;步骤6:数据服务器的存储:数据服务器用于存储原始数据化文献库、关系索引文献库、逻辑学习文献库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津赛因哲信息技术有限公司,未经天津赛因哲信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610982515.5/,转载请声明来源钻瓜专利网。