[发明专利]一种文本中知识领域识别方法及系统有效

专利信息
申请号: 201710141937.4 申请日: 2017-03-10
公开(公告)号: CN106897270B 公开(公告)日: 2020-01-24
发明(设计)人: 牟冬梅;黄丽丽;李茵;琚沅红;戴文浩;王萍;赵丹宁;郑晓月 申请(专利权)人: 吉林大学
主分类号: G06F40/30 分类号: G06F40/30;G06F40/205;G06N5/04
代理公司: 11227 北京集佳知识产权代理有限公司 代理人: 罗满
地址: 130000 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 知识 领域 识别 方法 系统
【权利要求书】:

1.一种文本中知识领域识别方法,其特征在于,包括:

步骤S1:判断相关领域概念和目标领域概念是否出现在同一句子中,若是,则进行步骤S2,若否,则进行步骤S6;

步骤S2:判断所述相关领域概念的数量是否唯一,若是,则判定找到概念/关系对,若否,则进行步骤S3;

步骤S3:计算第一相关领域概念距离和第二相关领域概念距离之差的绝对值,得到第一相对距离,其中,所述第一相关领域概念距离为第一相关领域概念与所述目标领域概念之差的绝对值,所述第二相关领域概念距离为第二相关领域概念与所述目标领域概念之差的绝对值;

步骤S4:判断所述第一相对距离是否大于或等于第一阈值,若是,则进行步骤S5,若否,则根据语境进行分析,以得到概念/关系对;

步骤S5:判定所述第一相关领域概念距离和所述第二相关领域概念距离中的较小者相应的相关领域概念为概念/关系对;

步骤S6:判断步骤S1中所述相关领域概念在相邻句中是否唯一,若是,则判定找到概念/关系对,若否,则进行步骤S7;

步骤S7:计算第三相关领域概念距离和第四相关领域概念距离之差的绝对值,得到第二相对距离,其中,所述第三相关领域概念距离为第三相关领域概念与所述目标领域概念之差的绝对值,所述第四相关领域概念距离为第四相关领域概念与所述目标领域概念之差的绝对值;

步骤S8:判断所述第二相对距离是否大于或等于第二阈值,若是,则进行步骤S9,若否,则根据语境进行分析,以得到概念/关系对;

步骤S9:判定所述第三相关领域概念距离和所述第四相关领域概念距离中的较小者相应的相关领域概念为概念/关系对。

2.根据权利要求1所述的文本中知识领域识别方法,其特征在于,步骤S4中所述根据语境进行分析包括:

按照出现顺序获取所述第一相关领域概念、所述第二相关领域概念和所述目标领域的序列集合,根据所述序列集合进行分析。

3.根据权利要求1至2任一项所述的文本中知识领域识别方法,其特征在于,还包括:

若存在相关领域概念的数量大于2时,判断每一个相关领域概念是否曾被确认为所述目标领域概念的概念/关系对,若否,则判定为找到新概念/关系对,若是,则需要根据语境判断。

4.根据权利要求1至2任一项所述的文本中知识领域识别方法,其特征在于,还包括:

若存在相关领域概念的数量大于2时,判断每一个目标领域概念是否曾作为所述目标领域概念的结果出现,若否,则判定为找到新概念/关系对,若是,则需要根据语境判断。

5.一种文本中知识领域识别系统,其特征在于,包括同句判断模块、第一数量判断模块、第一相对距离计算模块、第一阈值判断模块、第一距离确定模块、第二数量判断模块、第二相对距离计算模块、第二阈值判断模块和第二距离确定模块,其中:

所述同句判断模块,用于判断相关领域概念和目标领域概念是否出现在同一句子中,若是,则控制所述第一数量判断模块工作,若否,则控制第二数量判断模块工作;

所述第一数量判断模块,用于判断所述相关领域概念的数量是否唯一,若是,则判定找到概念/关系对,若否,则控制所述第一相对距离计算模块工作;

所述第一相对距离计算模块,用于计算第一相关领域概念距离和第二相关领域概念距离之差的绝对值,得到第一相对距离,其中,所述第一相关领域概念距离为第一相关领域概念与所述目标领域概念之差的绝对值,所述第二相关领域概念距离为第二相关领域概念与所述目标领域概念之差的绝对值;

所述第一阈值判断模块,用于判断所述第一相对距离是否大于或等于第一阈值,若是,则控制所述第一距离确定模块工作,若否,则根据语境进行分析,以得到概念/关系对;

所述第一距离确定模块,用于判定所述第一相关领域概念距离和所述第二相关领域概念距离中的较小者相应的相关领域概念为概念/关系对;

所述第二数量判断模块,用于判断所述同句判断模块中的所述相关领域概念在相邻句中是否唯一,若是,则判定找到概念/关系对,若否,则控制所述第二相对距离计算模块工作;

所述第二相对距离计算模块,用于计算第三相关领域概念距离和第四相关领域概念距离之差的绝对值,得到第二相对距离,其中,所述第三相关领域概念距离为第三相关领域概念与所述目标领域概念之差的绝对值,所述第四相关领域概念距离为第四相关领域概念与所述目标领域概念之差的绝对值;

所述第二阈值判断模块,用于判断所述第二相对距离是否大于或等于第二阈值,若是,则控制所述第二距离确定模块工作,若否,则根据语境进行分析,以得到概念/关系对;

所述第二距离确定模块,用于判定所述第三相关领域概念距离和所述第四相关领域概念距离中的较小者相应的相关领域概念为概念/关系对。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710141937.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top