[发明专利]一种支持数据分类的贝叶斯分类器的硬件实现方法有效
申请号: | 201910442712.1 | 申请日: | 2019-05-25 |
公开(公告)号: | CN110197219B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 魏继增;薛臻;郭炜 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F18/2415 | 分类号: | G06F18/2415;G06F18/214 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 数据 分类 贝叶斯 硬件 实现 方法 | ||
一种支持数据分类的贝叶斯分类器的硬件实现方法,设计具有AXI接口的朴素贝叶斯分类器,将朴素贝叶斯分类器通过AXI接口经AXI总线送入CPU,朴素贝叶斯分类器的索引计算模块用于依次产生各个类别与各个属性索引并送入地址计算模块,地址计算模块根据顶层模块给出的待测试特征向量和接收到的索引计算模块的数据计算出访问概率快表的地址,概率计算模块通过贝叶斯公式、从概率快表取出的数据以及从址计算模块提到的各个类别与各个属性索引计算出后验概率,并将后验概率最大的类别作为分类结果送入顶层模块,顶层模块用于协调索引计算模块、地址计算模块、概率计算模块和概率快表的有序运行。本发明适用于一切离散化的数据集。
技术领域
本发明涉及一种贝叶斯分类器。特别是涉及一种支持数据分类的贝叶斯分类器的硬件实现方法。
背景技术
近年来,随着人工智能越来越受关注,机器学习也取得了长足的发展。机器学习是人工智能的核心,是一门多领域交叉学科,它涉及了概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
随着机器学习算法越来越成熟,机器学习中非常重要的一类算法——分类算法也不断被研究与完善,常用的方法包括贝叶斯、决策树、支持向量机、k近邻、逻辑回归、神经网络和深度学习等。在众多的分类算法中,贝叶斯方法以其简单性和高效性,一直被广泛地应用到各种文本、图像等的分类工作中,具有重要地位。贝叶斯分类方法是基于贝叶斯定理的一种统计学分类方法,它计算一个待测试元组属于每个类别的概率,并最终选出概率最大的类别作为分类结果。贝叶斯分类方法可分为朴素贝叶斯、半朴素贝叶斯分类等。
朴素贝叶斯分类器是假设特征向量各属性独立的前提下运用贝叶斯定理的概率分类器,是贝叶斯分类中最简单的一种。自上个世纪50年代,朴素贝叶斯分类方法就已经得到了广泛研究,在上个世纪60年代被引入到了文本信息检索界中,并且直到现在,它依然是一种热门的分类算法,被广泛应用到各种分类工作中。值得一提的是,尽管朴素贝叶斯分类器基于非常朴素的思想和非常简单的假设前提,但其在很多复杂的现实情形中仍然能够取得相当好的分类效果,同时,朴素贝叶斯分类器具备高度的可扩展性。不仅如此,朴素贝叶斯分类只需要根据少量的训练数据估计出必要的参数,再加上它的变量独立假设,因此只需要估计各个变量的方法,而不需要确定整个协方差矩阵。总结一句,朴素贝叶斯分类具有坚实的数学基础和稳定的分类效率,同时所需估计的参数很少,对数据缺失不太敏感,并且算法足够简单。
FPGA(Field Programmable Gate Array),即现场可编程门阵列,它作为一种半定制电路,由硬件描述语言(Hardware Description Language,HDL,主要有Verilog和VHDL)来完成硬件设计,以实现特定的功能,并且HDL对其的配置可随时擦除,因此FPGA能够反复使用。FPGA的优点在于,它既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。由于FPGA具有的相对丰富的内部资源,支持硬件编程,并且开发费用较低、风险较小、可以反复使用的特点,使其成为了科研实验的最佳选择。
目前,机器学习各种分类方法虽已被应用到计算机的各个领域,但大多数依然侧重于算法本身的研究,而针对其提出专用的硬件结构的研究工作则相对较少。由此来看,为分类算法定制适合其的硬件架构,是一种必然的趋势。到现在为止,大多数朴素贝叶斯分类器依然运行在通用处理器上,这样不仅效率不够高,同时也为云计算等大数据处理带来了不便。在众多机器学习分类算法中,朴素贝叶斯分类算法具有的数学基础坚实、算法简单而且分类效率较高的特性,这使得它非常适合于硬件实现。
发明内容
本发明所要解决的技术问题是,提供一种能够提高朴素贝叶斯分类器运行效率的支持数据分类的贝叶斯分类器的硬件实现方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910442712.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置