[发明专利]一种信息资源的融合方法以及装置在审
申请号: | 201810701604.7 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108805219A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 杨耀威;杨鸿宾;王肃;彭作文 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/10 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 张海洋 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息资源 组织结构 特征关键字 预设 融合 信息组织结构 分类结果 相似度 跨域 申请 分类 | ||
本申请提供了一种信息资源的融合方法以及装置,该方法包括:获取待融合的信息资源对应的特征关键字,以及所述信息资源之间的组织结构;根据所述信息资源对应的特征关键字之间的相似度,对所述信息资源进行分类,并使得分类结果满足:具有预设组织结构的信息资源在不同的类别中;其中,所述预设组织结构包括父子组织结构和/或兄弟组织结构。本申请实施例能够打破信息资源原本具有的信息组织结构,建立跨域信息资源之间的联系。
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种信息资源的融合方法以及装置。
背景技术
信息资源目录是信息系统中信息资源分类的一种方式。信息资源目录中的每条信息资源都称为一个元数据;例如政府信息资源目录是根据目录、信息组织、信息资源、元数据等相关概念,可以从技术角度定义政府信息资源目录体系为:以元数据为核心,以政务分类表和主题词表为控制词表,对政府信息资源进行网状组织,满足从分类、主题、应用等多个角度对政府信息资源进行管理、识别、定位、发现、评估与选择的工具。
信息资源目录按照其展现方式,一般有两种分类方式:其一,按照业务进行分类;其二,按照部门进行分类。这种分类方式导致了当前信息资源无法建立跨域信息资源之间的相关性。
发明内容
有鉴于此,本申请实施例的目的在于提供一种信息资源的融合方法以及装置,能够建立跨域信息资源之间的联系。
第一方面,本申请实施例提供了一种信息资源的融合方法,包括:
获取待融合的信息资源对应的特征关键字,以及所述信息资源之间的组织结构;
根据所述信息资源对应的特征关键字之间的相似度,对所述信息资源进行分类,并使得分类结果满足:具有预设组织结构的信息资源在不同的类别中;
其中,所述预设组织结构包括父子组织结构和/或兄弟组织结构。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中:获取待融合的信息资源对应的特征关键字,以及所述信息资源之间的组织结构,包括:
获取待融合的信息资源对应的信息资源目录,以及所述信息资源目录之间的组织结构;
根据所述信息资源对应的特征关键字之间的相似度,对所述信息资源进行分类,并使得分类结果满足:具有预设组织结构的信息资源在不同的类别中,包括:
根据所述信息资源目录之间的相似度,对所述信息资源目录进行分类,并使得到的分类结果满足具有预设组织结构的信息资源目录在不同类别中。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中:根据所述信息资源目录之间的相似度,对所述信息资源目录进行分类,包括:
根据所述信息资源目录名称之间的相似度,对所述信息资源目录进行分类;或者
根据所述信息资源目录编码之间的相似度,对所述信息资源目录进行分类。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中:根据所述信息资源对应的特征关键字之间的相似度,对所述信息资源进行分类,包括:
随机选取K个信息资源的特征关键字分别作为预设K个类别的聚类中心初始值;
执行如下聚类步骤:
针对各特征关键字中除本次K个聚类中心之外的各特征关键字中的每个特征关键字,确定该特征关键字分别与K个聚类中心之间的相似度;
确定本次K个聚类中心中与该特征关键字相似度最大的聚类中心;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810701604.7/2.html,转载请声明来源钻瓜专利网。