[发明专利]基于动态属性分析的信息检索方法有效
申请号: | 201410018199.0 | 申请日: | 2014-01-15 |
公开(公告)号: | CN103793480B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 赫熙煦;张民;贾海涛;陈雷霆 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 电子科技大学专利中心51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 属性 分析 信息 检索 方法 | ||
背景技术
目前对于信息需求主要矛盾不在于信息数量的限制,而在于如何精确、便捷的定位所需的信息,即如何根据搜索条件建立信息检索规则。信息检索目前的方式是基于被检索信息的静态属性分析结果来进行的。该方法的理论基础是粗糙集Rough Set。Rough Set建立了一个融合上近似集和下近似集的定义方式来将难以确认归属的数据进行划分。上近似集和下近似集通过等价关系可以写出明确的公式,这样边界数据的不确定特性就可以被计算出来,从而便于来考证系统对事物的了解程度。
解读数据集中的属性重要性是Rough Set理论中一项重要的分析,Rough Set通过分析不同属性组合对决策的支持力度来区分不同属性的重要性。属性重要性分析都是基于全局分析的,也就是说对属性重要性的确定是根据数据集中的所有样例数据得到的固定值,即静态属性。
目前的基于静态属性的信息检索方法通过对条件属性按照其对于最终信息决策的重要程度来进行区分,按照各条件属性的重要程度作为信息检索的搜索方向,即每次检索均选用当前重要程度最高的条件属性进行检索。这种方式是一种平均上的最优形式,其保证了信息检索从整体上来看是最优。但是,这种方式难以保证每次检索都是最优的,某些情况下全局的重要性跟中获得部分知识前提的局部分析上来说是不相符的,无法建立最优的信息检索规则更快地得到检索结果。
发明内容
本发明所要解决的技术问题是,提供一种提高信息检索的准确性和效率的信息检索方法。
本发明为解决上述技术问题所采样的技术方案是,基于动态属性分析的信息检索方法,包括以下步骤:
1)建立模糊等价关系,预先确定所有在不同条件属性组合以及不同条件属性值组合下的信息熵增量;
2)初始化信息检索的所有条件属性的属性重要值;
3)获取输入的条件属性及其属性值,使用在当前未使用的输入条件属性中选择最大属性重要值所对应的条件属性及其属性值进行检索;
4)判断信息检索是否完成,如是,输出检索结果,如否,进行步骤5);所述信息检索完成为检索出唯一的结果属性或者所有输入的条件属性均已使用且无新输入的条件属性及其属性值;
5)通过计算本次检索后的信息熵增量来动态更新未使用的条件属性的属性重要值后,返回步骤3)。
具体的,更新未使用的条件属性的属性重要值的方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410018199.0/2.html,转载请声明来源钻瓜专利网。