[发明专利]一种基于信息粒度的信息检索优化方法在审
申请号: | 201410550066.8 | 申请日: | 2014-10-16 |
公开(公告)号: | CN104376044A | 公开(公告)日: | 2015-02-25 |
发明(设计)人: | 傅涛;傅德胜;经正俊;孙文静 | 申请(专利权)人: | 江苏博智软件科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 224000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于信息粒度的信息检索优化方法,它涉及优化信息检索技术领域,根据知网系统判断文档的内容与主题关键字扩展集合是否一致;提取指定类别的训练文本集中所有句子与文本标题、子标题,生成特定类别的模式实例集合;广度优先遍历图,生成模式集合;根据模式集合中的模式元素对训练集中不同事件主题的激励程度,将模式集分为若干个对应不同事件主题的模式子集;它基于机器的模式自动抽取所得特征可能再某些方面要优于人类经验所定的特征,在进行海量文本的检索过程中,通过内容主题额初分可以有效的消除无关内容的干扰,加快了查找速度。 | ||
搜索关键词: | 一种 基于 信息 粒度 检索 优化 方法 | ||
【主权项】:
一种基于信息粒度的信息检索优化方法,其特征在于它利用内容识别和主题识别在粗细不同粒度之下进行计算的特性,设计了一种新的主题识别模型,步骤如下:(1)、主题关键字扩展,形成一个N层的主题识别树;(2)、根据知网系统判断文档的内容与主题关键字扩展集合是否一致;(3)、在步骤(2)中判断文档所涉及的事件主题是否一致;(4)、提取指定类别的训练文本集中所有句子与文本标题、子标题,生成特定类别的模式实例集合;(5)、使用“知网”系统实现模式实例集合中个实例的词或词组序列与概念的映射;(6)、广度优先遍历图,生成模式集合;(7)、根据模式集合中的模式元素对训练集中不同事件主题的激励程度,将模式集分为若干个对应不同事件主题的模式子集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏博智软件科技有限公司,未经江苏博智软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410550066.8/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置