[发明专利]基于农业领域本体库的语义检索系统和方法有效
申请号: | 201010608017.7 | 申请日: | 2010-12-16 |
公开(公告)号: | CN102073692A | 公开(公告)日: | 2011-05-25 |
发明(设计)人: | 吴华瑞;黄锋;赵春江;杨锋;顾静秋 | 申请(专利权)人: | 北京农业信息技术研究中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100097 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 农业 领域 本体 语义 检索系统 方法 | ||
1.一种基于农业领域本体库的语义检索系统,其特征在于,包括:
信息抽取模块,用于对从互联网上获取的信息进行结构化处理,生成农业资源库;
语义标注处理模块,用于对所述农业资源库中的资源数据进行本体语义标注,以文本格式存储,并计算标注本体的语义向量空间,然后将所述语义向量空间中标注本体词汇和已标注处理的资源数据的语义关联度,与已标注的文本资源一起入库,生成本体语义资源库;
语义索引处理模块,用于读取所述本体语义资源库中的文本数据,根据所述文本数据中的语义标注信息建立语义本体索引库以及全文索引库;
语义扩展模块,用于接收用户提交的自然语言查询语句,对所述自然语言查询语句进行分词处理及本体语义扩展处理,生成相应的本体语义扩展集返回给用户,用户参与对所述本体语义扩展集的过滤、补充并再次提交;
检索处理模块,用于根据所述本体语义扩展集进行检索,生成检索结果返回给用户。
2.如权利要求1所述的基于农业领域本体库的语义检索系统,其特征在于,所述系统还包括爬虫抓取模块,利用网络爬虫抓取工具对互联网上指定的农业网页进行信息获取。
3.如权利要求1所述的基于农业领域本体库的语义检索系统,其特征在于,所述语义扩展模块包括:
分词处理单元,用于对所述自然语言查询语句进行分词处理;
语义本体推理引擎,用于利用农业领域本体库,判断所述分词处理后的查询关键词结果中是否存在本体语义概念的角色,根据判断结果要求用户重新提交检索查询语句,或者进行下一步的语义扩展;
本体语义扩展处理单元,用于访问农业领域本体库,进行本体语义扩展,得到本体语义扩展集,并结合用户的参与对所述本体语义扩展集进行过滤和权重标识处理。
4.如权利要求1所述的基于农业领域本体库的语义检索系统,其特征在于,所述检索处理模块包括:
语义本体检索单元,用于将所述本体语义扩展集转化为语义查询检索式,根据所述语义查询检索式访问所述语义本体索引库,生成查询结果集;
全文检索单元,用于访问所述全文索引库进行全文检索,生成查询结果集;
排名处理单元,用于根据本体语义扩展集的本体词汇权重标识对所述查询结果集进行排名处理,生成检索结果返回给用户。
5.一种基于农业领域本体库的语义检索方法,其特征在于,包括如下步骤:
S1:对互联网上指定的农业网页进行信息获取,对获取的信息进行结构化处理,生成农业资源库;
S2:对所述农业资源库中的资源数据进行本体语义标注,然后以文本格式存储,并计算标注本体的语义向量空间,然后将所述语义向量空间中标注本体词汇和已标注处理的资源数据的语义关联度,与已标注的文本资源一起入库,生成本体语义资源库;
S3:读取所述本体语义资源库中的文本数据,根据所述文本数据中的语义标注信息建立语义本体索引库以及全文索引库;
S4:接收用户提交的自然语言查询语句,对所述自然语言查询语句进行分词处理及本体语义扩展处理,生成本体语义扩展集;
S5:根据所述本体语义扩展集进行检索,生成检索结果返回给用户。
6.如权利要求5所述的基于农业领域本体库的语义检索方法,其特征在于,所述S1利用网络爬虫抓取工具进行网页信息获取。
7.如权利要求5所述的基于农业领域本体库的语义检索方法,其特征在于,所述步骤S2中对所述农业资源库中的资源数据进行本体语义标注具体为:将资源数据中的与本体角色相关的词汇做上标记,即与本体概念建立映射关系。
8.如权利要求5所述的基于农业领域本体库的语义检索方法,其特征在于,所述步骤S3具体包括:
S301:读取本体语义资源库中的文本数据,判断文本数据中是否存在语义标注信息;若存在语义标注信息,则执行步骤302;
否则结束对该条文本数据建立语义本体索引库的流程,转而建立包括对应该条文本数据索引的全文索引库;
S302:读取文本数据的语义标注信息,所述语义标注信息存放在所述本体语义资源库中;
S303:结合本体语义资源库和文本数据,从中提取语义概念本体词汇,建立语义本体索引库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京农业信息技术研究中心,未经北京农业信息技术研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010608017.7/1.html,转载请声明来源钻瓜专利网。