[发明专利]构建当事人画像的方法及装置有效
申请号: | 201610792049.4 | 申请日: | 2016-08-31 |
公开(公告)号: | CN107784024B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 贾炜;石鹏;刘激扬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/338 | 分类号: | G06F16/338;G06F16/34 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 当事人 画像 方法 装置 | ||
本发明公开了一种构建当事人画像的方法及装置。其中,该方法包括:从预先构建的司法领域本体中查找目标当事人,其中,司法领域本体中包含本体概念及用于描述本体概念的属性的结构数据,本体概念包括当事人;在查找到目标当事人后,从用于描述本体概念的属性的结构数据中选取或者接收用户输入的结构数据中的用于描述所述目标当事人的属性的结构数据;根据选取的或者接收的用于描述目标当事人的属性的结构数据,构建目标当事人的当事人画像。本发明解决了相关技术中无法自动构建当事人画像的技术问题。
技术领域
本发明涉及数据处理领域,具体而言,涉及一种构建当事人画像的方法及装置。
背景技术
一份司法文书中往往包含了许多当事人的相关信息,这些相关信息对分析当事人特点,构建当事人画像都有很大价值。
相关技术在分析司法文书中的当事人时,主要采用人工方式从司法文书中摘录对应的当事人信息,对这些信息进行分类、归一化及统计处理。其中,信息摘录和分类规则都是由具体应用需求决定的,不同应用的信息摘录和分类规则有不同的侧重点。
然而,由于上述技术方案主要是由人工实现的,效率低,准确率差,难以在短期内完成大量司法文书的分析工作,并且人工获取数据存在标准不一、多少不等、重复使用比较困难的缺陷。
虽然,相关技术中还提供了一种有效的构建普通用户画像(如登录/浏览电商网站的用户的画像)的技术方案,但是该方案都是通过统计结构化数据的指定维度来实现的。而司法文书作为文本数据,而文本数据是非结构化数据,因而现有的构建普通用户画像自动构建方法不能直接用于构建当事人画像。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种构建当事人画像的方法及装置,以至少解决相关技术中无法自动构建当事人画像的技术问题。
根据本发明实施例的一个方面,提供了一种构建当事人画像的方法,包括:从预先构建的司法领域本体中查找目标当事人,其中,上述司法领域本体中包含本体概念及用于描述本体概念的属性的结构数据,上述本体概念包括当事人;在查找到上述目标当事人后,从用于描述本体概念的属性的上述结构数据中选取或者接收用户输入的结构数据中的用于描述上述目标当事人的属性的结构数据;根据选取的或者接收的用于描述上述目标当事人的属性的结构数据,构建上述目标当事人的当事人画像。
进一步地,根据选取的或者接收的用于描述上述目标当事人的属性的结构数据,构建上述目标当事人的当事人画像包括:在上述目标当事人为个体当事人的情况下,根据选取的用于描述上述目标当事人的属性的部分或全部结构数据,构建上述个体当事人的当事人画像;在上述目标当事人为群体当事人的情况下,根据选取的用于描述上述目标当事人的属性的部分或全部结构数据,构建上述群体当事人的当事人画像。
进一步地,通过以下步骤构建上述司法领域本体:根据上述本体概念及用于描述本体概念的上述属性,确定用于解析司法文书的文法的特征词及特征词对应的选择性变量;根据确定的特征词及特征词对应的选择性变量,构建上述文法;使用构建的上述文法,解析需要解析的司法文书,得到司法文书解析结果;将上述司法文书解析结果填充到上述司法领域本体中。
进一步地,在根据确定的特征词及特征词对应的选择性变量,构建上述文法之后,上述方法还包括:获取司法文书的行文特征;根据上述文法和上述司法文书的行文特征,构建文法段落特征模板和文法段落位置特征模板,每个模板中都包含对应的模板特征和文法子集,其中,使用构建的上述文法,解析需要解析的司法文书,得到司法文书解析结果包括:使用构建的上述文法段落特征模板,或者上述文法段落特征模板和上述文法段落位置特征模板,逐段解析上述需要解析的司法文书,得到司法文书解析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610792049.4/2.html,转载请声明来源钻瓜专利网。