[发明专利]一种用于法律文本信息挖掘的集成学习方法及系统在审

申请号：	201811511621.0	申请日：	2018-12-11
公开（公告）号：	CN109299753A	公开（公告）日：	2019-02-01
发明（设计）人：	段强;李锐;于治楼	申请（专利权）人：	济南浪潮高新科技投资发展有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/332;G06F16/335
代理公司：	济南信达专利事务所有限公司 37100	代理人：	冯春连
地址：	250100 山东省济南市***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种用于法律文本信息挖掘的集成学习方法，涉及信息挖掘和集成学习技术领域，通过对预处理后的法律文本进行不同特征的提取构建相应的特征工程模型，利用线性SVM分类器学习不同特征工程模型得出的文本向量，并将学习后的线性SVM分类器对预处理后的法律文本进行预测，通过Stacking方法集成预测结果，同时训练并构建集成学习模型，以针对待处理法律文本输出更加全面和准确度更高的预测结果。本方法能更好的综合已有的信息，发现信息中上下文的关联，以此形成更强的非线性划分能力，降低泛化误差，相较于单一模型的预测，在罪名、法条、刑期等内容的预测上准确度更高。另外，本发明还公开一种用于法律文本信息挖掘的集成学习系统。
搜索关键词：	法律文本集成学习信息挖掘预处理工程模型预测结果准确度线性SVM 分类器构建预测集成学习系统发现信息文本向量法条关联输出学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于法律文本信息挖掘的集成学习方法，其特征在于,首先，收集专业法律工作人员处理过的法律文本作为数据源，对数据源进行预处理，其次，针对预处理结果训练得出不同的特征工程模型，线性SVM分类器学习不同特征工程模型得出的文本向量，随后，线性SVM分类器根据学习结果对预处理后的数据源进行预测，通过Stacking方法集成预测结果，将预测结果用于集成学习模型的训练，训练完成的集成学习模型针对待处理法律文本输出更加全面和准确度更高的预测结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司，未经济南浪潮高新科技投资发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811511621.0/，转载请声明来源钻瓜专利网。

上一篇：一种基于聚类与信息熵的废旧动力电池一致性指标的优选方法
下一篇：一种无人值守自助收卡打印系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于法律文本信息挖掘的集成学习方法及系统在审

专利文献下载