[发明专利]一种基于特征提取的调解案件智能分派方法及系统有效
申请号: | 201811579026.0 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109783639B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 彭俊江;王辉;李建元;周国栋;陈涛;蒋伶华 | 申请(专利权)人: | 银江股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/289;G06F40/30;G06Q50/18 |
代理公司: | 杭州之江专利事务所(普通合伙) 33216 | 代理人: | 张慧英 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 提取 调解 案件 智能 分派 方法 系统 | ||
1.一种基于特征提取的调解案件智能分派方法,其特征在于包括如下步骤:
(1)采集调解案件数据,进行数据预处理后存入调解案件库;
(2)对调解案件文本进行分类处理,获得各案件类型的调解员调解案件集;
(3)对调解案件文本提取特征词,获得调解员调解案件特征库;
(4)对待分派调解案件文本进行分类与分词处理,确定分类结果,提取该案件特征词;
(5)比对待分派调解案件和同案件类型下各调解员调解案件的特征词相似度,结合各调解员当前工作量和服务评级,对调解员进行排序,分派调解案件。
2.根据权利要求1所述的一种基于特征提取的调解案件智能分派方法,其特征在于,所述分类的方法包括:将调解案件文本分词,获得词汇文本;对词汇文本进行向量化和归一化处理;对处理后的数据进行聚类,并根据专家经验分类添加标签,存入标签文本库;采用机器学习算法训练、优化分类模型,进而用于调解案件文本分类。
3.根据权利要求2所述的一种基于特征提取的调解案件智能分派方法,其特征在于,所述进行聚类时采用DBSCAN算法进行聚类,具体步骤如下:
(a)初始化选取邻域参数(∈,MinPts),∈为聚类半径,MinPts为最低样本数;
(b)计算距离,其中距离计算方式:欧式距离,点a(x11,x12,...,x1n)与b(x21,x22,...,x2n)间的欧式距离为
(c)通过距离度量方式找到样本xj的∈-邻域样本集N∈(xj),若样本集个数满足|N∈(xj)|≥MinPts,将xj加入核心对象样本集合Ωk;
(d)如果样本集合Ωk为空集,则结束流程;否则执行步骤(e);
(e)在Ωk中,随机选择核心对象o,执行步骤(b)直到算法结束生成聚类簇Ck;
(f)优化邻域参数组合,重复步骤(b),达到最佳聚类结果。
4.根据权利要求1所述的一种基于特征提取的调解案件智能分派方法,其特征在于,所述获得调解员调解案件特征库的方法包括:将调解案件文本分词,提取特征词,获得一级特征库;对特征词进行合并或扩展,获得二级特征库。
5.根据权利要求4所述的一种基于特征提取的调解案件智能分派方法,其特征在于,所述获得一级特征库的具体方法如下:统计常规词的组合词频,将组合词频满足设定阈值I的常规词组合作为新词汇加入词汇表;定义窗口长度L,采用窗口遍历的方法统计任意M个词汇组合出现的次数,将出现次数最高的K个组合中的词汇作为特征词,统计所述特征词中单个词汇的词频,将词频满足设定阈值II的词汇作为候选特征词,加入一级特征库。
6.根据权利要求5所述的一种基于特征提取的调解案件智能分派方法,其特征在于,所述获得二级特征库的具体方法如下:计算特征词的相似度;当两个特征词的相似度满足设定阈值III或两个特征词的相似度在一级特征库的特征词相似度值前N位时,则将两个特征词合并,保留其中一个特征词,将另一个特征词从一级特征库中去除;当两个特征词的相似度满足设定阈值IV时,从扩展词典中抽取对应的扩展词汇,对特征词进行扩展,将扩展特征词加入一级特征库,获得二级特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江股份有限公司,未经银江股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811579026.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于半监督学习的用户评论聚类方法
- 下一篇:一种类案推荐方法、系统及装置