[发明专利]模式识别有效
申请号: | 201180070347.8 | 申请日: | 2011-03-01 |
公开(公告)号: | CN103477339B | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | M.亚哈伦;I.科亨;R.伯格曼;D.谢克德 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | G06N7/00 | 分类号: | G06N7/00 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 谢攀,王洪斌 |
地址: | 美国德*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式识别 | ||
相关申请的交叉引用
本申请要求在2011年2月23日以Michal Aharon等人名义提交的第13/033,443号美国专利申请的优先权。
技术领域
本发明涉及模式识别。
背景技术
各种行业通常在大量有关现实生活问题的数据中寻找模式。例如,学习医学的人可能寻找指示患者的两个物理属性之间的相关性的模式。特别地,分析大型集合的患者数据可能指示共享某些特性和过去经验的个体面对特定类型疾病或其它不利情况的风险。在数据中找到这些模式给科学家提供能够帮助发现因果关系并从而找到治疗这类疾病的方法的附加工具。
诸如要素分析和主成分分析(PCA)之类的各种技术能够被用于将一组数据内的大量的可观测变量减少为较少数量的影响可观测变量的未观测到变量。观察这些未观测到变量有助于在数据内找到模式。但是,这类技术仅找到存在于大部分数据内的模式。在一些情况中,模式可能存在于较小百分比的数据内。这类模式不会被各种要素分析方法获得。
发明内容
根据本发明的一个方面,公开了一种用于由物理计算系统(100)来执行模式识别的方法,该方法包括:用所述物理计算系统(100),构造数据为二分图(200),所述二分图(200)内的一组实例节点(214)表示所述数据内的实例以及所述二分图(200)内的一组属性节点(216)表示所述实例的属性,所述实例节点(214)和所述属性节点(216)之间的边(218)表示所述属性的值;用所述物理计算系统(100),给每个所述实例节点(214)和每个所述属性节点(216)分配转移概率函数(302、402);以及用所述物理计算系统(100),对所述二分图(200)应用随机游走,所述随机游走利用所述转移概率函数(302、402);其中被分配给所述属性节点的所述转移概率函数(302、402)使得所述随机游走更可能在所述属性的值方面更接近的边(218)之间转移;并且用所述物理计算系统(100),通过确定所述边(218)中的哪条更频繁地被所述随机游走穿过,来确定所述数据中的模式。
根据本发明的另一个方面,公开了一种物理计算系统(100),包括:处理器(108);和通信地耦合到所述处理器(108)的存储器(102);其中所述处理器(108)被配置成:构造数据(106)为二分图(200),所述二分图(200)内的一组实例节点(214)表示所述数据(106)内的实例以及所述二分图(200)内的一组属性节点(216)表示所述实例的属性,所述实例节点(214)和所述属性节点(216)之间的边(218)表示所述属性的值;给每个所述实例节点(214)和每个所述属性节点(216)分配转移概率函数(302、402);对所述二分图(200)应用随机游走,所述随机游走利用所述转移概率函数(302、402);其中被分配给所述属性节点的所述转移概率函数(302、402)使得所述随机游走更可能在所述属性的值方面更接近的边(218)之间转移;并且其中所述处理器(108)被进一步配置成通过确定所述边(218)中的哪条更频繁地被所述随机游走穿过,来确定所述数据(106)中的模式。
附图说明
附图图示本文描述的原理的各种实施例,且是说明书的一部分。图示的实施例仅是示例而不限制权利要求的范围。
图1是示出根据本文描述的原理的一个示例的说明性的物理计算系统的示图。
图2是示出根据本文描述的原理的一个示例的说明性的二分图的示图。
图3是示出根据本文描述的原理的一个示例的在二分图内属性节点的转移概率函数的使用的示图。
图4是示出根据本文描述的原理的一个示例的在二分图内实例节点的转移概率函数的使用的示图。
图5A和5B是示出根据本文描述的原理的一个示例的指示两个不同属性之间的相关性的说明性图表的示图。
图6是示出根据本文描述的原理的一个示例的用于模式识别的说明性方法的流程图。
贯穿图表,相同的附图标记指定类似的但不一定是相同的元素。
具体实施方式
如上面提到的,诸如要素分析和主成分分析(PCA)之类的各种技术能够被用于将一组数据内大量的可观测变量减少为较少数量的影响可观测变量的未观测到变量。观察这些未观测到变量有助于在数据内找到模式。但是,这类技术仅找到存在于大部分数据内的模式。在一些情况中,模式可能存在于较小百分比的数据内。这类模式不会被各种要素分析方法获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180070347.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:标志识别
- 下一篇:在操作系统环境之间传输web数据