[发明专利]一种文本中知识领域识别方法及系统有效
申请号: | 201710141937.4 | 申请日: | 2017-03-10 |
公开(公告)号: | CN106897270B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 牟冬梅;黄丽丽;李茵;琚沅红;戴文浩;王萍;赵丹宁;郑晓月 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/205;G06N5/04 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 罗满 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 知识 领域 识别 方法 系统 | ||
1.一种文本中知识领域识别方法,其特征在于,包括:
步骤S1:判断相关领域概念和目标领域概念是否出现在同一句子中,若是,则进行步骤S2,若否,则进行步骤S6;
步骤S2:判断所述相关领域概念的数量是否唯一,若是,则判定找到概念/关系对,若否,则进行步骤S3;
步骤S3:计算第一相关领域概念距离和第二相关领域概念距离之差的绝对值,得到第一相对距离,其中,所述第一相关领域概念距离为第一相关领域概念与所述目标领域概念之差的绝对值,所述第二相关领域概念距离为第二相关领域概念与所述目标领域概念之差的绝对值;
步骤S4:判断所述第一相对距离是否大于或等于第一阈值,若是,则进行步骤S5,若否,则根据语境进行分析,以得到概念/关系对;
步骤S5:判定所述第一相关领域概念距离和所述第二相关领域概念距离中的较小者相应的相关领域概念为概念/关系对;
步骤S6:判断步骤S1中所述相关领域概念在相邻句中是否唯一,若是,则判定找到概念/关系对,若否,则进行步骤S7;
步骤S7:计算第三相关领域概念距离和第四相关领域概念距离之差的绝对值,得到第二相对距离,其中,所述第三相关领域概念距离为第三相关领域概念与所述目标领域概念之差的绝对值,所述第四相关领域概念距离为第四相关领域概念与所述目标领域概念之差的绝对值;
步骤S8:判断所述第二相对距离是否大于或等于第二阈值,若是,则进行步骤S9,若否,则根据语境进行分析,以得到概念/关系对;
步骤S9:判定所述第三相关领域概念距离和所述第四相关领域概念距离中的较小者相应的相关领域概念为概念/关系对。
2.根据权利要求1所述的文本中知识领域识别方法,其特征在于,步骤S4中所述根据语境进行分析包括:
按照出现顺序获取所述第一相关领域概念、所述第二相关领域概念和所述目标领域的序列集合,根据所述序列集合进行分析。
3.根据权利要求1至2任一项所述的文本中知识领域识别方法,其特征在于,还包括:
若存在相关领域概念的数量大于2时,判断每一个相关领域概念是否曾被确认为所述目标领域概念的概念/关系对,若否,则判定为找到新概念/关系对,若是,则需要根据语境判断。
4.根据权利要求1至2任一项所述的文本中知识领域识别方法,其特征在于,还包括:
若存在相关领域概念的数量大于2时,判断每一个目标领域概念是否曾作为所述目标领域概念的结果出现,若否,则判定为找到新概念/关系对,若是,则需要根据语境判断。
5.一种文本中知识领域识别系统,其特征在于,包括同句判断模块、第一数量判断模块、第一相对距离计算模块、第一阈值判断模块、第一距离确定模块、第二数量判断模块、第二相对距离计算模块、第二阈值判断模块和第二距离确定模块,其中:
所述同句判断模块,用于判断相关领域概念和目标领域概念是否出现在同一句子中,若是,则控制所述第一数量判断模块工作,若否,则控制第二数量判断模块工作;
所述第一数量判断模块,用于判断所述相关领域概念的数量是否唯一,若是,则判定找到概念/关系对,若否,则控制所述第一相对距离计算模块工作;
所述第一相对距离计算模块,用于计算第一相关领域概念距离和第二相关领域概念距离之差的绝对值,得到第一相对距离,其中,所述第一相关领域概念距离为第一相关领域概念与所述目标领域概念之差的绝对值,所述第二相关领域概念距离为第二相关领域概念与所述目标领域概念之差的绝对值;
所述第一阈值判断模块,用于判断所述第一相对距离是否大于或等于第一阈值,若是,则控制所述第一距离确定模块工作,若否,则根据语境进行分析,以得到概念/关系对;
所述第一距离确定模块,用于判定所述第一相关领域概念距离和所述第二相关领域概念距离中的较小者相应的相关领域概念为概念/关系对;
所述第二数量判断模块,用于判断所述同句判断模块中的所述相关领域概念在相邻句中是否唯一,若是,则判定找到概念/关系对,若否,则控制所述第二相对距离计算模块工作;
所述第二相对距离计算模块,用于计算第三相关领域概念距离和第四相关领域概念距离之差的绝对值,得到第二相对距离,其中,所述第三相关领域概念距离为第三相关领域概念与所述目标领域概念之差的绝对值,所述第四相关领域概念距离为第四相关领域概念与所述目标领域概念之差的绝对值;
所述第二阈值判断模块,用于判断所述第二相对距离是否大于或等于第二阈值,若是,则控制所述第二距离确定模块工作,若否,则根据语境进行分析,以得到概念/关系对;
所述第二距离确定模块,用于判定所述第三相关领域概念距离和所述第四相关领域概念距离中的较小者相应的相关领域概念为概念/关系对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710141937.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种论文价值评估方法
- 下一篇:新闻正文噪音去除方法及系统