[发明专利]一种类型关系的获取方法及装置有效
申请号: | 201510900876.6 | 申请日: | 2015-12-09 |
公开(公告)号: | CN105550253B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 葛宁 | 申请(专利权)人: | 上海优扬新媒信息技术有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/903;G06F16/28 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 201210 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类型 关系 获取 方法 装置 | ||
1.一种类型关系的获取方法,其特征在于,所述方法包括:
获得各实体以及各实体的描述文本;
获得各实体对应的类型;
根据每个类型对应的各实体的描述文本,生成每个类型的描述文本;
根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,M为正整数;
其中,所述根据每个类型对应的各实体的描述文本,生成每个类型的描述文本,包括:
对每个类型对应的各实体的描述文本进行切词处理,以获得切词结果;
利用类型知识库在各切词结果中进行匹配;
若一个切词结果中包含所述类型知识库中定义的关键词,提取包含该切词结果的文本片段;
根据提取到的各文本片段,生成每个类型的描述文本。
2.根据权利要求1所述的方法,其特征在于,所述获得各实体对应的类型,包括:
根据类型分类知识,并按照类型对各实体进行聚合,以获得各实体对应的类型;或者,
将各实体分别输入类型分类模型,以使得类型分类模型对各实体进行类型分类,以获得各实体对应的类型。
3.根据权利要求1所述的方法,其特征在于,所述根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,包括:
获得指定的关系模板,所述关系模板对应一个类型关系,所述关系模板包括指示两个类型之间的类型关系的文本内容;
利用所述关系模板,在每个类型的描述文本中进行字符匹配,从每个类型的描述文本中抽取出N组类型;N大于或者等于M,且为正整数;
根据抽取出的N组类型,获得符合所述指定的类型关系的M组类型。
4.根据权利要求3所述的方法,其特征在于,所述根据抽取出的N组类型,获得符合所述指定的类型关系的M组类型,包括:
对所述N组类型中的P个类型进行名称归一化处理,P为正整数;
对于归一化处理后的N组类型,根据属于不同组的同一类型以及所述指定的类型关系,将N组类型合并成所述M组类型。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:将所述指定的类型关系和符合所述指定的类型关系的M组类型添加到知识图谱。
6.一种类型关系的获取装置,其特征在于,所述装置包括:
接收模块,用于获得各实体以及各实体的描述文本;
分类模块,用于获得各实体对应的类型;
生成模块,用于根据每个类型对应的各实体的描述文本,生成每个类型的描述文本;
获取模块,用于根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,M为正整数;
其中,所述生成模块,具体用于:
对每个类型对应的各实体的描述文本进行切词处理,以获得切词结果;
利用类型知识库在各切词结果中进行匹配;
若一个切词结果中包含所述类型知识库中定义的关键词,提取包含该切词结果的文本片段;
根据提取到的各文本片段,生成每个类型的描述文本。
7.根据权利要求6所述的装置,其特征在于,所述分类模块,具体用于:
根据类型分类知识,并按照类型对各实体进行聚合,以获得各实体对应的类型;或者,
将各实体分别输入类型分类模型,以使得类型分类模型对各实体进行类型分类,以获得各实体对应的类型。
8.根据权利要求6所述的装置,其特征在于,所述获取模块,具体用于:
获得指定的关系模板,所述关系模板对应一个类型关系,所述关系模板包括指示两个类型之间的类型关系的文本内容;
利用所述关系模板,在每个类型的描述文本中进行字符匹配,从每个类型的描述文本中抽取出N组类型;N大于或者等于M,且为正整数;
根据抽取出的N组类型,获得符合所述指定的类型关系的M组类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海优扬新媒信息技术有限公司,未经上海优扬新媒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510900876.6/1.html,转载请声明来源钻瓜专利网。