[发明专利]文件分类系统及方法在审
申请号: | 201310169201.X | 申请日: | 2013-05-09 |
公开(公告)号: | CN104142947A | 公开(公告)日: | 2014-11-12 |
发明(设计)人: | 李忠一;柳岳岑;卢俊锜 | 申请(专利权)人: | 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 无 | 代理人: | 无 |
地址: | 518109 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 分类 系统 方法 | ||
1.一种文件分类系统,应用于电子装置,其特征在于,该系统包括:
资料获取模块,用于获取指定的文件集及多维多阶分类描述;
文件分类模块,用于根据多维多阶分类描述中每个分类与文件集中每篇文件的相似度,对每篇文件进行多维多阶分类;及
结果输出模块,用于当所有文件分类完毕时,在电子装置的显示设备上输出每篇文件在各维度各阶层的分类。
2.如权利要求1所述的文件分类系统,其特征在于,所述文件分类模块对每篇文件进行多维多阶分类包括:
提取该文件集的核心词汇与多维多阶分类描述的核心词汇;
根据提取的核心词汇组成词文矩阵,对该词文矩阵做降阶处理得到一个概念矩阵;
将多维多阶分类描述的核心词汇转换成概念矩阵中的分类描述向量,同时获取每篇文件在概念矩阵中的文件向量;
根据分类描述向量与文件向量的相似度,对每篇文件进行多维多阶分类。
3.如权利要求2所述的文件分类系统,其特征在于,所述文件分类模块根据分类描述向量与文件向量的相似度,对每篇文件进行多维多阶分类包括:
将多维多阶分类描述拆成多个单维多阶分类;
将单维多阶分类描述拆成单维单阶分类描述;
依次获取文件集中每个文件的文件向量,计算每个单维单阶的分类描述在概念矩阵中的向量与该文件向量的相似度;
若当前分类描述在概念矩阵中的向量与当前文件向量的相似度大于预设值,则将当前文件加入当前分类。
4.如权利要求3所述的文件分类系统,其特征在于,所述当前分类描述在概念矩阵中的向量与当前文件向量的相似度为当前分类描述在概念矩阵中的向量与当前文件向量的夹角的余弦值。
5.如权利要求3所述的文件分类系统,其特征在于,所述文件分类模块还用于:
如果当前分类包含子分类,则继续计算每个子分类描述在概念矩阵中的向量与当前文件向量的相似度;
若当前子分类描述在概念矩阵中的向量与当前文件向量的相似度大于预设值,则更新当前文件的分类,将当前文件加入当前子分类。
6.如权利要求1所述的文件分类系统,其特征在于,所述每篇文件在各维度各阶层的分类通过一个文件分类表输出。
7.一种文件分类方法,应用于电子装置,其特征在于,该方法包括:
资料获取步骤,获取指定的文件集及多维多阶分类描述;
文件分类步骤,根据多维多阶分类描述中每个分类与文件集中每篇文件的相似度,对每篇文件进行多维多阶分类;及
结果输出步骤,当所有文件分类完毕时,在电子装置的显示设备上输出每篇文件在各维度各阶层的分类。
8.如权利要求7所述的文件分类方法,其特征在于,所述文件分类步骤包括:
提取该文件集的核心词汇与多维多阶分类描述的核心词汇;
根据提取的核心词汇组成词文矩阵,对该词文矩阵做降阶处理得到一个概念矩阵;
将多维多阶分类描述的核心词汇转换成概念矩阵中的分类描述向量,同时获取每篇文件在概念矩阵中的文件向量;
根据分类描述向量与文件向量的相似度,对每篇文件进行多维多阶分类。
9.如权利要求8所述的文件分类方法,其特征在于,所述根据分类描述向量与文件向量的相似度,对每篇文件进行多维多阶分类的步骤包括:
将多维多阶分类描述拆成多个单维多阶分类;
将单维多阶分类描述拆成单维单阶分类描述;
依次获取文件集中每个文件的文件向量,计算每个单维单阶的分类描述在概念矩阵中的向量与该文件向量的相似度;
若当前分类描述在概念矩阵中的向量与当前文件向量的相似度大于预设值,则将当前文件加入当前分类。
10.如权利要求9所述的文件分类方法,其特征在于,所述当前分类描述在概念矩阵中的向量与当前文件向量的相似度为当前分类描述在概念矩阵中的向量与当前文件向量的夹角的余弦值。
11.如权利要求9所述的文件分类方法,其特征在于,所述文件分类步骤还包括:
如果当前分类包含子分类,则继续计算每个子分类描述在概念矩阵中的向量与当前文件向量的相似度;
若当前子分类描述在概念矩阵中的向量与当前文件向量的相似度大于预设值,则更新当前文件的分类,将当前文件加入当前子分类。
12.如权利要求7所述的文件分类方法,其特征在于,所述每篇文件在各维度各阶层的分类通过一个文件分类表输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司,未经鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310169201.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:互联网数据分析系统
- 下一篇:一种同款业务对象聚合、搜索的方法和系统