[发明专利]一种基于大数据的律师评估方法及推荐方法有效
申请号: | 201810271936.6 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108509588B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 李明奇;杨开平;王志勇;覃思义;李良;何国良;张勇;李厚彪;李小平 | 申请(专利权)人: | 李明奇 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/26;G06F16/36;G06F40/289;G06F40/194 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 王霞 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 律师 评估 方法 推荐 | ||
1.一种基于大数据的律师评估方法,其特征在于:包括以下步骤:
S1.采集用户发布的法律问题及律师回答对应法律问题的答复信息,形成数据库;
S2.对步骤S1中的数据库进行预处理,剔除掉无效数据,形成有效数据库,进行预处理的具体步骤如下:
S201.将步骤S1中的数据库中法律问题与预存的无效问题进行比对,将比对结果一致的法律问题及其对应的答复进行剔除,形成初次预处理数据库;
S202.对步骤S201中的初次预处理数据库中的法律问题的文本长度L设置模型参考阈值k,将文本长度L参考阈值k的法律问题及其对应的答复进行剔除,形成有效数据库;
S3.对步骤S2中有效数据库进行评估,得到每个律师的专业水平数据,得到专业水平数据的具体步骤如下:
S301.将当前律师在回答法律问题的所有答复信息中的关键词与法律专业领域的词汇库进行对比分析,通过词语语义相似度得到有效数据库中所有律师的专业水平的第一排名;
S302.将当前律师在回答法律问题的所有答复信息中引用法律条文的答复信息数目Nlaw与所有的答复信息数目N0进行计算,通过Nlaw/N0的比值得到有效数据库中所有律师的专业水平的第二排名;
S303.将当前律师在回答法律问题的所有答复信息的文本长度分别进行基于对数函数的计算,通过答复信息的充实程度得到有效数据库中所有律师的专业水平的第三排名,所述的答复信息的充实程度需满足:
其中,Li为当前律师对第i条法律法律问题进行答复时对应的答复信息的文本长度,m为常数,N0为数据库中当前律师回复的所有法律问题的数目;
S304.将当前律师在回答法律问题的所有答复信息与差答复关键词集合Tkey分别进行比对,当一条答复信息出现Tkey即判定当前答复信息为差答复,通过差答复的数量得到有效数据库中所有律师的专业水平的第四排名;
S305.将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断,通过当前律师的答复相似度得到有效数据库中所有律师的专业水平的第五排名;
将当前律师在回答法律问题的所有答复信息的关键字之间进行相似度判断时,设Ak={wk1,wk2,wk3,…,wki,…,wkk}表示的是词语个数为k的一条答复信息的词集,其中,wki表示Ak中的第i个词语;设Ap={wp1,wp2,wp3,…wpi,…,wpp}表示的是词语个数为p的答复信息的词集,其中,wpi表示Ap中的第i个词语;
Mijn为第n次去掉矩阵Skp的第i行和第j列的余子阵;答复信息Ak和答复信息Ap的相似矩阵记为Skp=(sij),其中
sij=TEXTSIM(ωki,wpj)(i=1,2,3,…,k;j=1,2,3,…,p);
答复信息Ak和答复信息Ap的相似度的判断步骤如下:
S305a.找出相似矩阵Skp的第1行的最大值在第i列,这个最大值记为m1,再去掉矩阵中的这个最大值所在的行列,即去掉矩阵Skp的第1行和第i列得到余子阵M1i1;
S305b.找余子阵M1i1第1行的最大值在第j列,这个最大值记为m2,再去掉矩阵M1i1中第1行的这个最大值所在的行列,即去掉矩阵M1i1的第1行和第j列得到余子阵M1j2;
S305c.重复步骤S305a与步骤S305b,直到得到余子阵为空矩阵,则答复信息Ak和答复信息Ap之间的相似度满足:
其中,l为查找的次数;TEXTSIM(Ak,Ap)的值越大,表示答复信息Ak和答复信息Ap的相似度越高;
S306.通过S301中的第一排名、S302中的第二排名、S303中的第三排名、S304中的第四排名及S305中的第五排名得到有效数据库中所有律师的专业水平的最终排名,所述的最终排名即为专业水平数据;
S4.对步骤S2中有效数据库进行评估,得到每个律师的擅长领域数据;
得到擅长领域数据时,统计不同的法律的专业领域的专业词语,并将当前律师在回答法律问题的所有答复信息中关键字与各个专业领域的专业词语分别进行比对,通过比对结果得到擅长领域数据;
将当前律师在回答法律问题的所有答复信息中关键字与各个专业领域的专业词语分别进行比对时,具体步骤如下:
S401a.将有效数据库中的每个律师的答复信息进行分组处理,即分成每一个问答对;
S401b.将步骤S401a中得到的问答对中的答复信息的文本进行特征词汇提取;
S401c.将步骤S401b中提取出的特征词汇和专业领域词语Sp(p为0,1,2,3,4,…,T)计算相似度值,然后得到每个特征词汇所属的专业领域,并为每个特征词汇标记领域标签,得到标签特征词汇;
计算相似度值时,设律师当前答复信息中第i个词语为wi,专业领域p中的第j个词语为wpj;
计算wi与wpj的相似度时,当wi=wpj时,在基于之前词向量的基础上增加其权重为w=1+s;对于当前答复信息中词语wi和专业领域中的词语wpj之间的相似度SIMp(wi,wpj)需满足:
S401d.将步骤S401c中得到的标签特征词汇进行分类处理,则含有最多数目的标签特征词汇的专业领域即为当前律师最擅长的专业领域,由此得到当前律师的擅长领域信息;
S401e.采集步骤S401a中得到的问答对中的法律问题的数量,设当前律师在任一专业领域中答复的法律问题为Nfield,当前律师答复的所有法律问题的数量为N0,通过Nfield/N0得到有效数据库中当前律师的擅长领域信息;
将步骤S401d中得到的擅长领域信息与步骤S401e中得到的擅长领域信息结合进行加权计算即可得到当前律师的擅长领域数据;
S5.将步骤S3中的专业水平数据及步骤S4中的擅长领域数据与对应的律师信息均存储至有效数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李明奇,未经李明奇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810271936.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置