[发明专利]农用土地流转信息检索方法和系统有效
申请号: | 201410503602.9 | 申请日: | 2014-09-26 |
公开(公告)号: | CN104536957B | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 宫阿都;李玉洁;陈云浩;岳建伟;崔言辉;苏永荣;李冰 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京京万通知识产权代理有限公司11440 | 代理人: | 许天易,马云超 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 农用 土地 流转 信息 检索 方法 系统 | ||
技术领域
本发明涉及一种农业用土地流转信息的检索方法,本发明还涉及一种农业用土地信息检索系统。
背景技术
目前主流的搜索引擎检索算法是基于关键词匹配的检索算法,常用的排序算法包括词频位置加权排序算法、Direct Hit算法、PageRank算法等。
基于关键词匹配的检索算法中,可以将所有只要包含查询语句中涉及词语中的一个或多个的信息全部检索出来,这种词形匹配方式容易造成检索结果冗余。而且在进行土地流转信息检索时,没有考虑该类信息的地理位置相关性的重要特点,往往得不到理想的结果。
目前,尽管图像、视频等内容的检索技术也有了很好的发展,但是网络上绝大多数的信息为文本信息,因此文本信息检索在信息检索领域仍然占据着主要地位。文本信息检索是传统(文献)检索方式的延续,是指从大量的文本资源集合中自动地找到与用户查询条件相关的各种信息。传统的文本信息检索采用的技术模型主要有布尔模型、向量空间模型和概率模型,使用较多的是向量空间模型。
传统的基于关键词检索的文本信息检索方法存在许多问题:
(1)基于关键词检索方法中较常使用的检索模型是是向量空间模型,此模型可以将任意文档表示成词条向量。当文本数量较多时,该词项-文档矩阵将成为高阶稀疏矩阵,空间维数较高,内存占用空间较大,信息处理速度较慢。
(2)基于关键词检索方法仅仅考虑字形匹配,没有考虑文本信息中词语之间的语义关系,不能处理同义词、近义词的问题,准确率并不理想。
(3)农用土地流转信息中包括很多地理信息,当用户检索一块区域的流转信息时,基于关键字匹配的检索方法没有办法考虑地理位置的空间信息,将包含在该区域内的地块信息全部检索出来。
此外,在针对检索结果进行排序的算法中,词频位置加权排序算法是基于网页信息内容分析的排序算法,其中词语与网页内容的相似度则由它出现的频次和位置决定。DirectHit是一种注重信息质量和用户行为反馈的排序算法,网页被点击的次数和浏览的时间长度都影响网页与用户查询语句的相似度。PageRank算法是一种链接分析算法。在该算法中,网页的重要性由两部分决定:(1)该页面被多少页面引用;(2)该页面被什么页面引用。针对土地流转信息的特点,应该充分考虑空间关系对地理要素的语义相似度的影响,并将这一部分作为影响文档与查询语句相似度的一个重要因素。
发明内容
针对现有技术中的不足,本发明旨在提供一种基于地名匹配的农用土地流转信息检索方法,以解决传统算法对于土地流转供求信息检索效果不佳的问题。
进一步地,在此基础上,本发明还提供了一种基于地理要素的土地流转信息排序方法,以解决传统算法对于检索出的土地流转供求信息排序效果不佳的问题。
为了解决上述问题,该种农用土地流转信息检索方法,其包括如下步骤:
服务器接收用户输入的检索条件;
服务器对检索条件和待检索的农用土地流转信息进行分词处理,得到分词化检索条件和分词化农用土地流转信息;
服务器查找分词化检索条件中的包含的地名信息,并根据地名匹配算法找到各地名信息所包含的下级地名信息;
服务器根据该地名信息以及下级地名信息对所述分词化农用土地流转信息进行筛选,得到筛选后的分词化农用土地流转信息;
服务器根据分词化检索条件和筛选后的分词化农用土地流转信息创建向量空间模型,得到词汇-文档矩阵;
服务器计算该词汇-文档矩阵中的分词化检索条件与筛选后的分词化农用土地流转信息之间的相似度sim1;
服务器将相似度sim1满足一定阈值的农用土地流转信息发送给用户。
优选地,还包括步骤:
所述服务器得到词汇-文档矩阵后,对该词汇-文档矩阵进行潜语义分析操作,得到去噪后的词汇-文档矩阵,服务器根据该去噪后的词汇-文档矩阵计算分词化检索条件与筛选后的分词化农用土地流转信息之间的相似度sim1。
更优选地,所述对词汇-文档矩阵进行潜语义分析操作包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410503602.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置