[发明专利]分类规则生成装置、分类规则生成方法、分类规则生成程序以及记录介质有效
申请号: | 201180064827.3 | 申请日: | 2011-01-13 |
公开(公告)号: | CN103299304A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 柴田秀哉;加藤守;郡光则 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 崔成哲 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 规则 生成 装置 方法 程序 以及 记录 介质 | ||
1.一种分类规则生成装置,其特征在于,具备:
输入部,输入文档而作为样本对象文档;
储存部,存储从所述样本对象文档针对每个分类类型抽出形成所述样本对象文档的部分、并且用于将分类对象的分类对象文档分类为多个所述分类类型中的某一个的分类规则的制作中使用的部分文本的抽出条件,其中,针对所述多个分类类型的每一个设定了所述抽出条件;
对照部,对照所述储存部中储存的所述抽出条件、和输入到所述输入部的所述样本对象文档;
抽出部,根据由所述对照部得到的对照结果,尝试从所述样本对象文档针对每个所述分类类型抽出所述部分文本的部分文本抽出;以及
学习部,在通过所述抽出部的所述部分文本抽出抽出了与所述分类类型对应的所述部分文本的情况下,进行使用了所抽出的所述部分文本的规定的机械学习,从而生成所述分类规则。
2.根据权利要求1所述的分类规则生成装置,其特征在于,
针对每个所述分类类型设定的所述抽出条件包括适合于对应的所述分类类型的至少一个恰当的恰当关键字,
所述对照部具备位置确定部,该位置确定部针对所述样本对象文档,针对每个所述分类类型,确定所述恰当关键字的存在位置,
所述抽出部根据所述位置确定部确定的所述恰当关键字的存在位置,从所述样本对象文档,抽出包括所述恰当关键字的所述恰当关键字的周边而作为所述部分文本。
3.根据权利要求2所述的分类规则生成装置,其特征在于,
关于针对每个所述分类类型设定的所述抽出条件,在所述恰当关键字的至少一个中设定了表示所述恰当关键字的类别的类别信息,
所述抽出部在希望从所述样本对象文档抽出与所述分类类型对应的所述部分文本的情况下,根据由所述位置确定部确定的所述恰当关键字表示的类别信息,尝试所述部分文本抽出。
4.根据权利要求3所述的分类规则生成装置,其特征在于,
所述抽出部在希望从所述样本对象文档抽出与所述分类类型对应的所述部分文本的情况下,在由所述位置确定部确定的所述恰当关键字的类别信息中的、表示特定的类别的类别信息的个数小于设定值的情况下,不从所述样本对象文档抽出与所述分类类型对应的所述部分文本。
5.根据权利要求3所述的分类规则生成装置,其特征在于,
所述抽出部在希望从所述样本对象文档抽出与所述分类类型对应的所述部分文本的情况下,仅在由所述位置确定部确定的所述恰当关键字的类别信息包括表示特定的类别的所述类别信息的情况下,将所述样本对象文档作为抽出与所述分类类型对应的所述部分文本的抽出对象。
6.根据权利要求3所述的分类规则生成装置,其特征在于,
所述抽出部在希望从所述样本对象文档抽出与所述分类类型对应的所述部分文本的情况下,根据由所述位置确定部确定的所述恰当关键字的类别信息表示的所述类别,变更与所述分类类型对应的所述部分文本的大小。
7.根据权利要求1所述的分类规则生成装置,其特征在于,
针对每个所述分类类型设定的所述抽出条件包括不适合于对应的所述分类类型的至少一个不恰当的不恰当关键字,
所述对照部具备位置确定部,该位置确定部针对所述样本对象文档,针对每个所述分类类型,确定所述不恰当关键字的存在位置,
所述抽出部根据所述位置确定部确定的所述不恰当关键字的存在位置,从所述样本对象文档去除包括所述不恰当关键字的所述不恰当关键字的周边。
8.根据权利要求7所述的分类规则生成装置,其特征在于,
关于针对每个所述分类类型设定的所述抽出条件,在所述不恰当关键字的至少一个中设定表示所述不恰当关键字的类别的类别信息,
所述抽出部在希望从所述样本对象文档抽出与所述分类类型对应的所述部分文本的情况下,根据由所述位置确定部确定的所述不恰当关键字表示的类别信息,尝试所述部分文本抽出。
9.根据权利要求8所述的分类规则生成装置,其特征在于,
所述抽出部在希望从所述样本对象文档抽出与所述分类类型对应的所述部分文本的情况下,在由所述位置确定部确定的所述不恰当关键字的类别信息中的、表示特定的类别的类别信息的个数是设定值以上的情况下,不从所述样本对象文档抽出与所述分类类型对应的所述部分文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180064827.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种时延补偿方法及装置
- 下一篇:鸡眼扣用垫圈和鸡眼扣安装方法