[发明专利]基于机器学习的电子文档分析系统及方法有效
申请号: | 201810236000.X | 申请日: | 2018-03-21 |
公开(公告)号: | CN108334501B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 王欣;杨煜清;施举红 | 申请(专利权)人: | 王欣;杨煜清;施举红 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G16H50/70 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 武媛;吕学文 |
地址: | 100005 北京市东城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于机器学习的电子文档分析系统及方法,利用文档特征描述模块对所提交的电子文档结构进行描述,若描述大于一个的电子文档结构,机器学习算模块判别最符合于当前电子文档的描述类型,再进行结构解析;机器学习算法模块依据电子文档结构解析结果和目标信息内容特征进行模型训练和信息提取,分析者对内容特征描述或机器学习算法提取的目标信息进行修改,机器学习算法模块将对修改内容特征对应的模型重新进行训练;分析结果审核模块将机器学习算法模块的模型训练和信息提取结果呈现给电子文档分析者。本发明有效解决机器学习算法文档数量有限和特征动态变化情况下的学习问题,能够让算法真正辅助文档分析,提升分析效率。 | ||
搜索关键词: | 基于 机器 学习 电子 文档 分析 系统 方法 | ||
【主权项】:
1.基于机器学习的电子文档分析系统,其特征在于,所述分析系统包括:用户管理模块,用于为使用分析系统的电子文档分析者创建账号信息,通过注册登录服务进入分析系统;任务管理模块,用于电子文档分析者创建分析任务以及邀请他人参与任务协作进行电子文档分析;文档提交模块,用于将电子文档分析者搜集的电子文档提交到分析系统;文档特征描述模块,用于电子文档分析者通过分析系统提供的电子文档特征描述语言对所提交的电子文档结构和待提取的目标信息进行特征描述;机器学习算法模块,用于根据电子文档分析者描述的电子文档结构特征解析电子文档并依据内容特征进行模型构建,同时根据构建模型进行文字和图像模型训练和信息提取,对于图像信息的处理过程中同时记录文字和图像的位置对应关系;分析结果审核模块,用于将机器学习算法模块的模型训练和信息提取结果呈现给电子文档分析者,供电子文档分析者查阅目标信息在所分析电子文档中的上下文和预测结果,并对预测结果进行纠正和备注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王欣;杨煜清;施举红,未经王欣;杨煜清;施举红许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810236000.X/,转载请声明来源钻瓜专利网。