[发明专利]基于词汇统计的档案分类系统及方法有效
申请号: | 201610786178.2 | 申请日: | 2016-08-31 |
公开(公告)号: | CN107451168B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 陈嬿如;林春风;王昱钧;许庭玮 | 申请(专利权)人: | 台湾中华电信股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/284 |
代理公司: | 北京戈程知识产权代理有限公司 11314 | 代理人: | 程伟;王锦阳 |
地址: | 中国台*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 词汇 统计 档案 分类 系统 方法 | ||
本发明是提供一种基于词汇统计的档案分类系统及方法。前述的方法运行于具备运算能力的电子装置,包含下列步骤:首先,读取一个或多个档案的档案描述信息,以及一个或多个用户历史操作信息;接着,自用户历史操作信息萃取出一个或多个词汇信息,并计算词汇信息位于档案描述信息的权重值,并依权重值自词汇信息中挑选词汇信息以作为虚拟目录列表的列表卷标以建立特定档案的连结。通过前述的处理后即可自动的对各个档案建立标签及链接,让用户可方便的进行档案管理。
技术领域
本发明是一种档案分类技术手段,尤指一种基于词汇统计的档案分类系统及方法。
背景技术
为能方便的管理电子档案,用户大多会依照属性将各个档案放置在特定的文件夹,然而当各个档案具有多个属性时,前述的方案并无法让使用者便捷的存取档案。
为解决前述的问题,部分的使用者会透过人工方式对各个档案设定属性卷标,而用户在点选各个标签后即可开启特定的档案,举例说明之,当使用者持有档案「花莲旅游计划书.doc」时,可对此档案设定卷标「花莲」以及卷标「旅游」,因此当使用者点选其中一个标签时,即可开启该档案。
只是上述的方案需通过人工方式进行分类以及设定,因此使用者需耗费相当多的时间来执行重复性工作,而造成使用者相当大的困扰。而当档案数量日益增加时,前述的管理方案会严重的降低使用者的操作意愿。
综上所述,如何提供一种可自动进行档案分类技术方案乃本领域亟需解决的技术问题。
发明内容
为解决前揭的问题,本发明的目的是提供一种基于词汇统计的档案分类系统及方法。
为达上述目的,本发明提出一种基于词汇统计的档案分类系统。前述的系统运行于具备运算能力的电子装置,并包含读取模块以及处理模块。前述的读取模块是读取一个或多个档案的档案描述信息以及一个或多个用户历史操作信息。前述的处理模块连接读取模块,并自用户历史操作信息萃取出一个或多个词汇信息、计算词汇信息位于档案描述信息的权重值,并依权重值自词汇信息中挑选词汇信息以作为虚拟目录列表的列表卷标,其中列表卷标是用于建立特定档案的连结。
为达上述目的,本发明提出一种基于词汇统计的档案分类方法。前述的方法运行于具备运算能力的电子装置,并包含下列步骤:首先,读取一个或多个档案之档案描述信息,以及一个或多个用户历史操作信息。接着,自用户历史操作信息萃取出一个或多个词汇信息,并计算词汇信息位于档案描述信息的权重值,并依权重值自词汇信息中挑选词汇信息以作为虚拟目录列表的列表卷标,其中列表卷标是用于建立特定档案的连结。
综上所述,本发明的基于词汇统计的档案分类系统及其方法可对档案内容中的词汇进行统计分析,并依权重值选取出特定的词汇作为虚拟目录列表的列表卷标,而得以提供使用者更为便捷的档案管理方案。
附图说明
图1为本发明第一实施例基于词汇统计的档案分类系统的系统方块图。
图2为本发明第二实施例基于词汇统计的档案分类方法的方法流程图。
图3~图5为本发明第二实施例档案分类方法的细部运作流程图。
图6为本发明词汇权重排序流程图。
图7为本发明后缀数组的示意图。
图8为本发明字典顺序排序的示意图。
图9为本发明优化虚拟目录列表示意图。
图10为本发明档案分类画面。
附图标记说明
1 基于词汇统计的档案分类系统
11 读取模块
12 处理模块
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于台湾中华电信股份有限公司,未经台湾中华电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610786178.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多级旋转式建筑工程用过滤装置
- 下一篇:一种用于制茶的滚筒式鲜叶风选机