[发明专利]一种人民矛盾调解案例搜索和调解策略推荐方法有效

申请号：	201710285854.2	申请日：	2017-04-27
公开（公告）号：	CN107220295B	公开（公告）日：	2020-02-07
发明（设计）人：	王开红;李建元;陈涛;蒋伶华;范鸿俊;温晓岳	申请（专利权）人：	银江股份有限公司
主分类号：	G06F16/9535	分类号：	G06F16/9535;G06F16/35
代理公司：	33241 杭州斯可睿专利事务所有限公司	代理人：	王利强
地址：	310012 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	调解策略提示聚类类别自动生成相关度索引搜索预处理全文搜索引擎案例分析案例数据标签信息界面展示输入查询数据收集搜索结果索引创建特征聚类向量表示准确率分词脱敏创建矛盾
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种人民矛盾调解案例搜索和调解策略推荐方法，其特征在于：包括以下步骤：

步骤1：数据收集、预处理

收集人民调解案例信息，存储在数据库中，需要包含的字段包括：纠纷详情、调解结果、调解详情、调解时间、结束时间、调解人、所属地区、调解机构和评价字段，其中，纠纷详情、调解详情和评价是文本数据，其他字段均为结构化数据；

对收集到的数据进行预处理，确保调解结果、调解详情字段不为空，将重复数据删除；

步骤2：分词及向量表示

创建矛盾调解专业领域词典mediate.txt，将容易分词错误的词，该词包括矛盾调解专业领域词汇，根据调解案例数据将无法正确切分的词，加入矛盾调解专业领域词典mediate.txt；另外汉语中还存在一些无意义的词，将这些无意义、区分度不高的词加入停用词典stopword.txt，分词时直接将停用词去掉不作分析；

根据词典mediate.txt和停用词典stopword.txt将文本字段进行分词，将文本数据表示为向量的形式；

步骤3：TF_CDF特征聚类

由于矛盾调解案例无详细类别信息，采用TF_CDF计算文本单词权重，并进行TF_CDF特征聚类获案例详细类别及类别关键词，同时从聚类结果中获取单词TF_CDF值；

步骤4：自动脱敏并进行案例评分，生成脱敏典型案例集；

步骤5：生成调解策略提示

以带有类别标签的典型案例作为分析数据，某一个类别按照以下过程生成调解策略：

(5.1)获取带有类别标签的典型案例集，提取调解策略字段；

(5.2)调解策略有一二三条例标识，按照标识将调解策略断开，形成调解条例；

(5.3)将调解条例进行TF_CDF聚类分析，并提取调解条例的关键词；

(5.4)对调解条例进行类别评分，评分依据包括类别中包含调解条例的条数、具有相同关键字的调解条例在类别中所占的比例；

(5.5)对调解条例进行评分，评分依据包括：条例中类别关键词出现的个数和次数和文本的质量；

(5.6)将调解条例类别评分降序排序，提取评分较高的类别，在这些类别中提取分值高的调解条例，作为调解策略提示信息，保存在数据库中；