[发明专利]一种文本中知识领域识别方法及系统有效
申请号: | 201710141937.4 | 申请日: | 2017-03-10 |
公开(公告)号: | CN106897270B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 牟冬梅;黄丽丽;李茵;琚沅红;戴文浩;王萍;赵丹宁;郑晓月 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/205;G06N5/04 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 罗满 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本中知识领域识别方法,通过判断相关概念领域和目标概念领域的位置,若相关概念领域的数量唯一,则找到概念/关系对,若相关概念领域的数量不唯一,则对同句或相邻句中的相关概念领域和目标概念领域的相对距离进行计算,若相对距离大于或等于阈值,则距离目标概念领域更近的相关概念领域为概念/关系对,若小于阈值,则需要根据语境进行分析判断,可以较快速地处理文本中知识领域之间的匹配关系,从而提高了文本中知识领域的识别效率。本发明还公开了一种文本中知识领域识别系统,具有与上述权利要求相同的技术效果,在此不再赘述。 | ||
搜索关键词: | 一种 文本 知识 领域 识别 方法 系统 | ||
【主权项】:
1.一种文本中知识领域识别方法,其特征在于,包括:/n步骤S1:判断相关领域概念和目标领域概念是否出现在同一句子中,若是,则进行步骤S2,若否,则进行步骤S6;/n步骤S2:判断所述相关领域概念的数量是否唯一,若是,则判定找到概念/关系对,若否,则进行步骤S3;/n步骤S3:计算第一相关领域概念距离和第二相关领域概念距离之差的绝对值,得到第一相对距离,其中,所述第一相关领域概念距离为第一相关领域概念与所述目标领域概念之差的绝对值,所述第二相关领域概念距离为第二相关领域概念与所述目标领域概念之差的绝对值;/n步骤S4:判断所述第一相对距离是否大于或等于第一阈值,若是,则进行步骤S5,若否,则根据语境进行分析,以得到概念/关系对;/n步骤S5:判定所述第一相关领域概念距离和所述第二相关领域概念距离中的较小者相应的相关领域概念为概念/关系对;/n步骤S6:判断步骤S1中所述相关领域概念在相邻句中是否唯一,若是,则判定找到概念/关系对,若否,则进行步骤S7;/n步骤S7:计算第三相关领域概念距离和第四相关领域概念距离之差的绝对值,得到第二相对距离,其中,所述第三相关领域概念距离为第三相关领域概念与所述目标领域概念之差的绝对值,所述第四相关领域概念距离为第四相关领域概念与所述目标领域概念之差的绝对值;/n步骤S8:判断所述第二相对距离是否大于或等于第二阈值,若是,则进行步骤S9,若否,则根据语境进行分析,以得到概念/关系对;/n步骤S9:判定所述第三相关领域概念距离和所述第四相关领域概念距离中的较小者相应的相关领域概念为概念/关系对。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710141937.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种论文价值评估方法
- 下一篇:新闻正文噪音去除方法及系统