[发明专利]基于客观信息论的智慧法院系统大数据处理方法及装置有效
申请号: | 202111201097.9 | 申请日: | 2021-10-15 |
公开(公告)号: | CN113641825B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 许建峰;孙福辉;陈奇伟;李晓慧;刘振宇;陈宝贵;余超;王晓燕;张雅雯 | 申请(专利权)人: | 人民法院信息技术服务中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06Q50/18 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘飞;贾磊 |
地址: | 100745 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 客观 信息论 智慧 法院系统 数据处理 方法 装置 | ||
1.一种基于客观信息论的智慧法院系统大数据处理方法,其特征在于,所述方法包括:
从目标法院系统中获取在指定时间段内的数据文本集合,所述数据文本集合包括规则文本集合、实体文本集合和案件文本集合,所述规则文本用于描述实体与实体之间、实体与过程之间、过程与过程之间运转规则及关联关系的信息;实体文本用于描述法院业务相关的主体的信息;案件文本为法院系统运行过程中以案件为中心产生的数据, 具体用于描述实体在各类法院业务活动中所产生的数据;
根据所述数据文本集合,按照法院数据模型确定每个数据文本集合中的多个子数据文本集合;
根据客观信息论的度量模型,从所述子数据文本集合中提取所述度量模型中每个测度项对应的度量数据,得到度量数据集合,具体为,根据所述客观信息论的度量模型,确定每个所述测度项的度量计算公式;根据所述度量计算公式,确定每个测度项所需的度量数据;从所述子数据文本集合中提取每个测度项对应的度量数据,得到度量数据集合;
确定不同子数据文本集合对应的不同的基于所述度量模型的测度项组合;
根据所述测度项组合,从所述度量数据集合中进行聚类分析,得到针对每个子数据文本集合的度量数据组合;
根据所述度量数据组合,计算获得所述目标法院系统中每个子数据文本集合的信息值,所述信息值用于表示所述子数据文本集合的价值;
根据所述目标法院系统中每个子数据文本集合的信息值,结合法院数据模型中数据文本集合和子数据文本集合,计算获得所述目标法院系统的数据评分结果;
当所述数据评分结果不满足预设要求时,则向所述目标法院系统输出调整指令,以优化所述目标法院系统中的数据。
2.根据权利要求1所述的方法,其特征在于,所述从目标法院系统中获取在指定时间段内的数据文本集合,包括:
确定待提取数据文本集合的数据类型;
根据所述待提取数据文本集合的数据类型,确定所述待提取数据文本集合的存储位置;
根据所述待提取数据文本集合的存储位置,提取指定时间段内的数据文本,形成所述数据文本集合。
3.根据权利要求2所述的方法,其特征在于,信息论的度量模型包括广阔度、细致度、持续度、丰富度、容积度、延迟度、遍及度、真实度和适配度。
4.根据权利要求1所述的方法,其特征在于,所述从所述子数据文本集合中提取每个测度项对应的度量数据,得到度量数据集合,包括:
针对每个子数据文本集合:
获取所述子数据文本集合中的子数据文本;
依次从所述子数据文本中提取每个测度项对应的度量数据,得到初始度量数据集合;
计算每个测度项对应的度量数据的标准差;
根据每个测度项对应的度量数据的标准差,从所述初始度量数据集合中筛选出满足预设条件的度量数据,以获得度量数据集合。
5.根据权利要求4所述的方法,其特征在于,所述预设条件为:
,
其中,为第
6.根据权利要求1所述的方法,其特征在于,所述确定不同子数据文本集合对应的不同的基于所述度量模型的测度项组合,包括:
获取所述子数据文本集合的文本内容的属性;
确定所述信息论的度量模型中每个测度项的度量属性;
根据所述文本内容的属性和所述度量属性,计算获得所述子数据文本集合和每个测度项的属性关联度;
将属性关联度超过预设值的测度项确定为所述子数据文本集合对应的测度项,以获得所述子数据文本集合对应的测度项组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民法院信息技术服务中心,未经人民法院信息技术服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111201097.9/1.html,转载请声明来源钻瓜专利网。