[发明专利]同名人物的识别处理方法及处理装置在审
申请号: | 202010167476.X | 申请日: | 2020-03-11 |
公开(公告)号: | CN111428503A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 吴信东;刘古刘;李磊 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/36;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 230009 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同名 人物 识别 处理 方法 装置 | ||
1.一种同名人物的识别处理方法,其特征在于,包括:
获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息;
从所述描述信息中提取包含时间上下文的人物属性和事件信息;
计算所述人物集合中任意两个人物的属性相似度和事件信息相似度;
至少基于所述属性相似度和事件信息相似度确定所述人物集合中所述任意两个人物是否为同一人物。
2.根据权利要求1所述的识别处理方法,其特征在于,获取与目标人物具有相同姓名的人物集合以及每一个人物的描述信息,包括:
从人物知识图谱数据库中提取具有相同姓名的人物集合,以及从每个人物集合中获取所述每一个人物的描述信息。
3.根据权利要求1所述的识别处理方法,其特征在于,至少基于所述属性相似度和事件信息相似度确定所述人物集合中所述任意两个人物是否为同一人物,包括:
获取所述目标人物所在的知识图谱中的目标关系相似度;
基于所述属性相似度、所述事件信息相似度和所述目标关系相似度确定所述人物集合中所述任意两个人物是否为同一实体。
4.根据权利要求3所述的识别处理方法,其特征在于,所述目标关系相似度通过以下方式确定:
对所述任意两个人物的亲属关系相似度与社交关系相似度进行加权求和,得到所述目标关系相似度;
其中,所述亲属关系相似度权重系数大于社交关系相似度。
5.根据权利要求3所述的识别处理方法,其特征在于,基于所述属性相似度、所述事件信息相似度和所述目标关系相似度确定所述人物集合中所述任意两个人物是否为同一实体,包括:
对所述属性相似度、所述事件信息相似度和所述目标关系相似度进行加权求和,得到目标相似度;
比较所述目标相似度与设定阈值,若所述目标相似度大于或等于所述设定阈值,则确定所述任意两个人物属于同一实体。
6.根据权利要求3所述的识别处理方法,其特征在于,获取所述任意两个人物在所述目标人物所在的知识图谱中的目标关系相似度之前,还包括:
获取现有的每个人物的关系列表其中,rsubject表示关系主体,rname表示关系名,robject表示关系客体。
7.根据权利要求1所述的识别处理方法,其特征在于,从所述描述信息中提取包含时间上下文的人物属性和事件信息,包括:
对于人物pi,采用时间正则表达式提取描述信息中的时间序列将人物pi描述信息按所述时间序列Ti分段,得到分段文本序列W={W1,W2,...Wn},其中分段文本bk表示文本、表示时间标签,k=1,2,3,…,n。
8.根据权利要求7所述的识别处理方法,其特征在于,采用时间正则表达式提取描述信息中的时间序列将描述信息按所述时间序列Ti分段,得分段文本序列W={W1,W2,...Wn}之后,所述方法包括:
对分段文本依据字典库和依存句法分析工具或关系抽取工具提取人物关系集合其中表示按照分段文本提取的人物关系集合;
对人物所有分段文本进行人物关系的提取,得到
利用提取的人物关系集合补充所述人物pi的关系集合得到人物关系知识图谱
从人物关系知识图谱获取所述任意两个人物的亲属关系相似度与社交关系相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010167476.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度的板材折弯机
- 下一篇:脊柱侧弯测量椅