[发明专利]构建当事人画像的方法及装置有效
申请号: | 201610792049.4 | 申请日: | 2016-08-31 |
公开(公告)号: | CN107784024B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 贾炜;石鹏;刘激扬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/338 | 分类号: | G06F16/338;G06F16/34 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 当事人 画像 方法 装置 | ||
1.一种构建当事人画像的方法,其特征在于,包括:
从预先构建的司法领域本体中查找目标当事人,其中,所述司法领域本体中包含本体概念及用于描述本体概念的属性的结构数据,所述本体概念包括当事人;
在查找到所述目标当事人后,从用于描述本体概念的属性的所述结构数据中选取或者接收用户输入的结构数据中的用于描述所述目标当事人的属性的结构数据;
根据选取的或者接收的用于描述所述目标当事人的属性的结构数据,构建所述目标当事人的当事人画像。
2.根据权利要求1所述的方法,其特征在于,通过以下步骤构建所述司法领域本体:
根据所述本体概念及用于描述本体概念的所述属性,确定用于解析司法文书的文法的特征词及特征词对应的选择性变量;
根据确定的特征词及特征词对应的选择性变量,构建所述文法;
使用构建的所述文法,解析需要解析的司法文书,得到司法文书解析结果;
将所述司法文书解析结果填充到所述司法领域本体中。
3.根据权利要求2所述的方法,其特征在于,在根据确定的特征词及特征词对应的选择性变量,构建所述文法之后,所述方法还包括:
获取司法文书的行文特征;
根据所述文法和所述司法文书的行文特征,构建文法段落特征模板和文法段落位置特征模板,每个模板中都包含对应的模板特征和文法子集,
其中,使用构建的所述文法,解析需要解析的司法文书,得到司法文书解析结果包括:
使用构建的所述文法段落特征模板,或者所述文法段落特征模板和所述文法段落位置特征模板,逐段解析所述需要解析的司法文书,得到司法文书解析结果。
4.根据权利要求3所述的方法,其特征在于,使用所述文法段落特征模板和所述文法段落位置特征模板,逐段解析所述需要解析的司法文书,得到司法文书解析结果包括:
从所述需要解析的司法文书中提取的目标段落;
为所述目标段落匹配对应的文法段落特征模板;
若匹配成功,则使用匹配上的文法段落特征模板,解析所述目标段落,得到对应的解析结果,并跳转到下一个目标段落的解析流程;
若匹配失败,则为所述目标段落匹配对应的文法段落位置特征模板,若匹配成功,则使用匹配上的文法段落位置特征模板,解析所述目标段落,得到对应的解析结果,并跳转到下一个目标段落的解析流程。
5.根据权利要求4所述的方法,其特征在于,在解析所述目标段落的过程中,所述方法还包括:
若对应的解析结果为空,则至少记录所述需要解析的司法文书的序列号和所述目标段落;
将记录结果填充到所述司法领域本体中。
6.根据权利要求2所述的方法,其特征在于,在使用构建的所述文法,解析需要解析的司法文书,得到司法文书解析结果之后,所述方法还包括:
根据所述司法文书解析结果,构建各当事人之间的关联关系;
统计每个当事人的数值型属性;
在各当事人之间的关联关系构建完成后,统计每个当事人的关联关系的各维度的统计值;
将所述各当事人之间的关联关系、所述每个当事人的数值型属性以及所述每个当事人的关联关系的各维度的统计值填充到所述司法领域本体中。
7.一种构建当事人画像的装置,其特征在于,包括:
查找单元,用于从预先构建的司法领域本体中查找目标当事人,其中,所述司法领域本体中包含本体概念及用于描述本体概念的属性的结构数据,所述本体概念包括当事人;
处理单元,用于在查找到所述目标当事人后,从用于描述本体概念的属性的所述结构数据中选取或者接收用户输入的结构数据中的用于描述所述目标当事人的属性的结构数据;
第一构建单元,用于根据选取的或者接收的用于描述所述目标当事人的属性的结构数据,构建所述目标当事人的当事人画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610792049.4/1.html,转载请声明来源钻瓜专利网。