[发明专利]基于内容的文档自动分类入库方法在审
申请号: | 202111477683.6 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114328911A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 付睿智;田苗;张建斌 | 申请(专利权)人: | 苏州海赛人工智能有限公司;付睿智 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 李延峰 |
地址: | 215000 江苏省苏州市中国(江苏)自由贸易*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 内容 文档 自动 分类 入库 方法 | ||
1.基于内容的文档自动分类入库方法,其特征在于,包括以下步骤:
S1、文档预处理
内容识别:对待分类的电子文档进行内容识别并表示为对应于电子文档的词频向量;
文档内容分类:根据电子文档的词频向量输出电子文档的内容类别属性;
特征空间匹配:根据电子文档的词频向量计算电子文档在相关联的特征空间中的特征向量占比;
S2、文档缓存
根据文档的特征向量占比最大值向对应的特征空间输入电子文档数据;
S3、文档读取
根据文档读取的检索词与特征空间进行匹配,并将相应的特征空间内的电子文档数据进行读取反馈。
2.如权利要求1所述的基于内容的文档自动分类入库方法的应用系统,其特征在于,包括电性连接的文档协同管理子系统、文档预处理子系统、数据缓存子系统和数据存储子系统;
所述文档协同管理子系统包括数据管理模块、资源监控与管理模块、检索索引模块;
所述文档预处理子系统包括内容识别模块、文档内容分类模块、特征空间匹配模块;
所述数据缓存子系统包括内存数据库和分类写入模块;
所述数据存储子系统包括文件生成模块、文件管理模块和文件存储模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州海赛人工智能有限公司;付睿智,未经苏州海赛人工智能有限公司;付睿智许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111477683.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种零部件尺寸匹配装置及方法
- 下一篇:一种可多角度监控的网络摄像机
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法