[发明专利]一种非结构信息处理与资源管理系统有效
申请号: | 201811290541.7 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109492100B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 李刚;石淮 | 申请(专利权)人: | 武汉雨滴科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/30;G06F40/289 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 杨本官 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于非结构信息与资源处理技术领域,尤其涉及一种非结构信息处理与资源管理系统。本发明利用自定义的处理策略以及规则处理方案,形成了灵活快捷的数据采集和处理方案,同时能够对非结构性信息数据进行有效分析处理;能够有效降低用户学习使用的成本,提高非结构性信息数据处理效率。 | ||
搜索关键词: | 一种 结构 信息处理 资源管理 系统 | ||
【主权项】:
1.一种非结构信息处理与资源管理系统,其特征在于,由信息管理模块、信息处理模块以及数据采集模块构成;信息管理模块,包括用于实现词库管理操作以实现词库的快速更新,包括修改、增删、检索词语的词库控件;用于实现数据源的增删查找的数据源控件;用于设置不同分类规则以对信息进行分类,包括增删、修改和查找规则的规则控件;用于配置文本分析功能,根据分词或者其他策略的组合形成或者修改信息处理的策略模式的策略控件;用于根据数据源以及策略配置,建立新的任务,并调用相应的数据源以及策略模型,对数据源进行相应的策略处理,并输出相应的数据结果的任务控件;信息处理模块,包括用于对信息进行自动分词,并完成关键信息提取的提取控件;用于完成文本转换、聚类以及对比的处理控件;提取控件采用规则匹配以及模型匹配对文本信息进行自动分词处理,并对词语进行词性标注,同时提取文本的关键字词和关键句作为摘要以便于快速阅览;处理控件还用于根据用户输入的路径录入信息文件,并根据操作历史形成日志文件;日志文件用于支持文件的持续更新读取等;在具体实施过程中,各处理控件表现为可编辑的下拉窗口或者链接至相应数据库的超文本编辑栏;分词处理还包括将信息数据中的文本进行分割处理,以将其划分为一个或者多个具有完整语义的字词单元,同时根据自定义或者用户输入或者调取频率进行优先级提取,以便于优先获取高频的关键词,快速形成关键词摘要;以及,基于规则处理以及统计方法相结合,从非结构信息中获取特定的地名、人名、号码等实体数据;数据采集模块,包括用于从数据源中采集数据,调用文本分析服务器相应的服务对数据进行自动处理,并将数据处理结果进行存储的数据采集控件;以及,用于利用规范性数据文件对数据信息进行修正和补充,或者进行定义数据的录入和修正;以实现对已采集数据进行定义的数据定义控件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉雨滴科技有限公司,未经武汉雨滴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811290541.7/,转载请声明来源钻瓜专利网。