[发明专利]信息过滤系统、信息过滤方法以及信息过滤程序无效
申请号: | 200880124282.9 | 申请日: | 2008-01-08 |
公开(公告)号: | CN101911067A | 公开(公告)日: | 2010-12-08 |
发明(设计)人: | 加藤守;郡光则 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 崔成哲 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 过滤 系统 方法 以及 程序 | ||
1.一种信息过滤系统,其特征在于,具备:
第1过滤器部,从输入设备输入属于多个种类中的至少任意一个种类的文档数据,使用CPU(Central Processing Unit,中央处理单元)来执行确定所输入的上述文档数据所属的种类的规定的分类处理,将输入的上述文档数据所属的种类确定为第1分类信息;
第2过滤器部,从输入设备输入上述文档数据,使用CPU来执行与上述第1过滤器部的上述分类处理不同的规定的分类处理,将输入的上述文档数据所属的种类确定为第2分类信息;
第1正确答案比较部,使用CPU,对将预先确定了所属的种类的多个学习文档数据分别作为上述文档数据而由上述第1过滤器部确定出的上述多个学习文档数据的上述第1分类信息、与表示预先确定的上述所属的种类的上述多个学习文档数据的正确答案信息进行比较,根据比较结果来生成表示上述第1分类信息是否与上述正确答案信息一致的上述多个学习文档数据的第1学习结果信息,将生成的上述多个学习文档数据的上述第1学习结果信息存储在存储设备中;
第2正确答案比较部,使用CPU,对将上述多个学习文档数据分别作为上述文档数据而由上述第2过滤器部确定出的上述多个学习文档数据的上述第2分类信息、与上述多个学习文档数据的上述正确答案信息进行比较,根据比较结果来生成表示上述第2分类信息是否与上述正确答案信息一致的上述多个学习文档数据的第2学习结果信息,将生成的上述多个学习文档数据的上述第2学习结果信息存储在存储设备中;
错误率计算部,使用CPU,根据上述第1正确答案比较部生成的上述多个上述学习文档数据的上述第1学习结果信息,计算表示上述第1分类信息与上述正确答案信息不一致的比例的第1错误率,并且使用CPU,根据上述第2正确答案比较部生成的上述多个上述学习文档数据的上述第2学习结果信息,计算表示上述第2分类信息与上述正确答案信息不一致的比例的第2错误率;以及
结果输出部,使用CPU,根据将分类为特定的种类的对象即分类对象文档数据作为上述文档数据而由上述第1过滤器部确定出的上述第1分类信息、将上述分类对象文档数据作为上述文档数据而由上述第2过滤器部确定出的上述第2分类信息、上述错误率计算部计算出的上述第1错误率、以及上述错误率计算部计算出的上述第2错误率,确定上述分类对象文档数据所属的种类,将确定出的种类作为分类结果而输出到输出设备。
2.根据权利要求1所述的信息过滤系统,其特征在于,
上述第1过滤器部是具备如下部件的学习型过滤器部:
学习部,从输入设备输入多组上述学习文档数据与上述正确答案信息的组,根据上述多组使用CPU来执行将属于各种类的各学习文档数据中通用的统计信息作为学习数据而生成的统计处理,将通过上述统计处理生成的上述学习数据存储在存储设备中;以及
学习型分类部,从输入设备输入上述分类对象文档数据,使用CPU,针对每个种类,计算上述分类对象文档数据对应于由上述学习部生成的上述学习数据表示的上述统计信息的比率而作为分类概率,根据每个种类的上述分类概率来确定上述分类对象文档数据所属的种类。
3.根据权利要求2所述的信息过滤系统,其特征在于,
上述学习部使用贝叶斯理论、SVM(Support Vector Machine,支持向量机)、和神经网络模型中的某一个进行上述统计处理。
4.根据权利要求3所述的信息过滤系统,其特征在于,
上述第2过滤器部是如下字符串匹配型过滤器部:
从输入设备输入上述文档数据,从将属于各种类的分类关键字预先存储为匹配条件信息的存储设备中输入上述匹配条件信息,使用CPU,执行判定上述匹配条件信息表示的各种类的上述分类关键字是否包含在上述文档数据中的字符串匹配处理,将通过上述字符串匹配处理判定为包含在上述文档数据中的上述分类关键字所属的种类确定为上述文档数据所属的种类。
5.根据权利要求4所述的信息过滤系统,其特征在于,
上述字符串匹配型过滤器部使用决定性有限自动机来进行上述字符串匹配处理。
6.根据权利要求5所述的信息过滤系统,其特征在于,
上述字符串匹配型过滤器部将表示上述分类关键字的上述决定性有限自动机的状态迁移表作为上述匹配条件信息而执行上述字符串匹配处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880124282.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:红豆杉细胞培养物及其大规模继代培养的方法
- 下一篇:燃料电池
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置