[发明专利]一种获得邻域和正域的方法和系统在审
申请号: | 201710384473.X | 申请日: | 2017-05-26 |
公开(公告)号: | CN107301460A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 彭政红;崔莉;赵泽 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 祁建国,梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种获得邻域和正域的方法和系统,包括将哈希分桶后的数据集作为算法的输入,遍历每个数据桶中的样本,通过正域标志判断当前样本是否已被标记为非正域样本,若是则对其他样本进行正域判断,否则查找当前样本的邻域样本;判断当前样本和邻域样本的决策属性值是否相同,若是则舍弃邻域样本,检索其它邻域样本,否则判断当前样本和邻域样本是否互为邻域,若是则通过正域标志将当前样本和邻域样本标记为非正域样本,否则舍弃邻域样本,检索当前样本的其它邻域样本。本发明利用邻域关系的对称性、哈希映射函数的局部敏感性和决策属性过滤策略优化了计算邻域和正域的计算效率。 | ||
搜索关键词: | 一种 获得 邻域 方法 系统 | ||
【主权项】:
一种获得邻域和正域的方法,其特征在于,包括:步骤1:将哈希分桶后的数据集作为算法的输入,其中该数据集包括多个数据桶,每个该数据桶由多个样本组成,遍历每个该数据桶中的样本,将当前遍历到的样本作为当前样本,并为每一个该样本设置一个正域标志,并将该正域标志的集合作为正域标志集合;步骤2:通过正域标志集合判断该当前样本是否已被标记为非正域样本,若是则终止对该当前样本的正域判断流程,对其他样本进行正域判断,否则在该数据集中查找该当前样本的邻域样本;步骤3:判断该当前样本和该邻域样本的决策属性值是否相同,若是则舍弃该邻域样本,检索该当前样本的其它邻域样本,否则判断该当前样本和该邻域样本是否互为邻域,若是则判定该当前样本属于非正域样本,并通过正域标志将该当前样本和该邻域样本标记为非正域样本,否则舍弃该邻域样本,检索该当前样本的其它邻域样本;步骤4:完成所有样本的正域判断后,输出该正域标志集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710384473.X/,转载请声明来源钻瓜专利网。
- 上一篇:基于强度传输方程的相位优化方法
- 下一篇:车辆维修资讯媒合方法