[发明专利]对实体关系模式进行聚类、提取的方法和设备有效
申请号: | 201210100155.3 | 申请日: | 2012-04-06 |
公开(公告)号: | CN103365912A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 缪庆亮;孟遥;于浩;葛乃晟;张波 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种对实体关系模式进行聚类、提取的方法和设备。对实体关系模式进行聚类的方法包括:对原始句子进行预处理,以识别原始句子中表示实体的实体词;根据实体词和关系词本体中的关系词以及实体词和关系词在预处理后的句子中的特定出现序列确定预处理后的句子中的实体词之间的实体关系,并且根据所确定的实体关系将预处理后的句子拆分成子句;提取拆分后的子句的实体关系模式,其中,子句的实体关系模式用实体词及实体词之间的中语境组成的关系元组来表示;计算所提取的子句的实体关系模式之间的第一相似度;以及根据所计算的子句的实体关系模式之间的第一相似度,将子句的实体关系模式聚类成实体关系模式类。 | ||
搜索关键词: | 实体 关系 模式 进行 提取 方法 设备 | ||
【主权项】:
一种对实体关系模式进行聚类的方法,包括:对原始句子进行预处理,以识别所述原始句子中表示实体的实体词;根据所述实体词和关系词本体中的关系词以及所述实体词和所述关系词在预处理后的句子中的特定出现序列确定所述预处理后的句子中的所述实体词之间的实体关系,并且根据所确定的实体关系将预处理后的句子拆分成子句;提取拆分后的子句的实体关系模式,其中,所述子句的实体关系模式用所述实体词及所述实体词之间的中语境组成的关系元组来表示;计算所提取的所述子句的实体关系模式之间的第一相似度;以及根据所计算的所述子句的实体关系模式之间的所述第一相似度,将所述子句的实体关系模式聚类成实体关系模式类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210100155.3/,转载请声明来源钻瓜专利网。