首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于随机森林技术的相似文件检索方法有效

申请号：	201610265593.3	申请日：	2016-04-25
公开（公告）号：	CN105930473B	公开（公告）日：	2019-04-05
发明（设计）人：	张静川;周宇;贾真	申请（专利权）人：	安徽富驰信息技术有限公司
主分类号：	G06F16/953	分类号：	G06F16/953
代理公司：	合肥天明专利事务所(普通合伙) 34115	代理人：	张祥骞;奚华保
地址：	230088 安徽省合肥***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	随机森林案件查询条件检索信息相似矩阵相似文件特征树检索裁判过滤条件检索结果权重训练输入方式条件选择有效检索综合权重决策树可视化相似度拟合输出展示统计
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于随机森林技术的相似文件检索方法，其特征在于，包括以下步骤：

11)裁判文书的组织，将裁判文书按照案由分层分类组织；

12)构造案件特征树，对于指定案由，筛选其公有特征和私有特征，并按特征间逻辑关系组织成树形结构；

13)对案件特征树进行权重训练，采用随机森林方法针对不同目标进行训练，计算出案件特征的综合权重；所述的随机森林方法针对不同目标进行训练包括以下步骤：

131)选取单一案由的裁判文书N份作为原始训练集，每个文书包含M个特征；

132)决策树的构造，对于分类目标T，在原始训练集中随机抽取n个文书为样本，剩余N-n个文书为袋外数据，在M个特征中随机抽取m个特征，构造一棵决策树；其中，m<M、n<N；

133)随机森林F的构造，对所有分类目标T均进行决策树的构造，构成包含K个决策树的随机森林F；

134)调整m的数值，重复进行决策树的构造和随机森林F的构造，直至随机森林F的准确率、召回率满足设定要求；

135)对准确率、召回率均满足设定要求的随机森林F的每一棵决策树，利用相应袋外数据计算袋外数据误差E0；

136)对此决策树的特征X处加入随机噪声，重新计算袋外数据误差E1；

137)计算特征X的绝对权重，其计算公式如下：

X(T)＝∑(E1-E0)/K；

138)重复步骤135至步骤137，针对随机森林F内的所有特征均进行绝对权重的计算；

139)对随机森林F内的全部特征的绝对权重进行归一化处理；

140)重复步骤132至步骤139，遍历处理全部分类目标；

141)计算遍历处理全部分类目标所得的各特征权重均值并归一化处理；

14)检索信息的获取，输入检索信息的过滤条件和查询条件，输入方式为条件选择、包含条件的文字或整篇裁判文书；

15)计算案件相似矩阵，根据检索信息的过滤条件从特征树集合中筛选有效特征树；根据检索信息的查询条件，利用权重树，采用加权曼哈顿距离方法计算有效特征树集合中两两相似度，组成相似矩阵，并对结果进行归一化处理；

16)输出检索结果，从案件相似矩阵中获取相似案件，找到与查询条件最相似的n个案件或相似度大于s的案件，对此信息进行统计，并进行可视化展示。

2.根据权利要求1所述的一种基于随机森林技术的相似文件检索方法，其特征在于，所述的构造案件特征树包括以下步骤：

21)定义公有特征，公有特征为案件一般属性特征；

22)定义私有特征，私有特征为案件的特殊属性；

23)根据特征之间的逻辑关系，将公有特征和私有特征组织成树形结构，形成案件特征树。

3.根据权利要求1所述的一种基于随机森林技术的相似文件检索方法，其特征在于，所述的计算案件相似矩阵包括以下步骤：

31)由案件特征树、特征权重树、查询条件计算生成两两案件相似度的矩阵；

32)由过滤条件获得有效案件，根据查询条件获得相应特征取值及权重，计算查询条件与案件、案件与案件的相似度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽富驰信息技术有限公司，未经安徽富驰信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610265593.3/1.html，转载请声明来源钻瓜专利网。

上一篇：信息通信方法及信息通信装置
下一篇：一种供电电路、单相单线计量电路及计量方法

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top