[发明专利]计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统无效

专利信息
申请号: 200980105767.8 申请日: 2009-02-25
公开(公告)号: CN101952824A 公开(公告)日: 2011-01-19
发明(设计)人: 比克沙·罗摩克里希纳;埃万德罗·B·戈维亚;本特·施密特-尼尔森;加勒特·魏因贝格;布雷特·A·哈沙姆 申请(专利权)人: 三菱电机株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 李辉;孙海龙
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算机 执行 数据库 中的 文献 进行 索引 检索 方法 以及 信息 检索系统
【权利要求书】:

1.一种计算机执行的、对数据库中的文献进行索引和检索的方法,该方法包括如下步骤:

将文献集合中的各文献转换为文献粒子图表,所述文献粒子图表包括从粒子集合中选择的粒子;

从相应的粒子图表中为各文献提取文献关键词集合;

将各文献的所述文献关键词存储至对存储所述文献集合的数据库的索引中;

将查询转换为包括查询粒子集合的查询粒子图表,所述查询粒子图表包括从所述粒子集合中选择的粒子;

从所述查询粒子图表中提取查询关键词集合;

根据所述查询关键词和存储在所述索引中的文献关键词从数据库中检索相关文献;以及

向用户输出所述相关文献。

2.根据权利要求1所述的方法,其中所述粒子集合实质性地大于所述文献的语言中音位的数目,并且实质性地小于所述语言中字词的数目。

3.根据权利要求1所述的方法,其中个别粒子跨越字词边界。

4.根据权利要求1所述的方法,其中所述文献和所述查询为文本字词的形式。

5.根据权利要求1所述的方法,其中所述文献为文本字词的形式,所述查询为讲话式字词的形式。

6.根据权利要求1所述的方法,其中所述文献和所述查询都为讲话式字词的形式。

7.根据权利要求1所述的方法,其中所述文献为讲话式字词的形式,所述查询为文本字词的形式。

8.根据权利要求1所述的方法,其中所述查询是被讲出的,所述查询粒子图表为表示讲出的查询中的声音序列的替代的连续分组的网格。

9.根据权利要求1所述的方法,其中所述粒子集合表示能在任一查询中出现的所有可能的声音序列。

10.根据权利要求1所述的方法,其中所述粒子集合从来自所述文献的字词的任何序列的发音得到。

11.根据权利要求1所述的方法,其中所述粒子集合识别任意文献中的将该文献与其它文献区别开的关键词。

12.根据权利要求1所述的方法,其中通过拼写-发音机制将所述文献粒子图表和所述查询粒子图表正规化。

13.根据权利要求1所述的方法,其中所述粒子集合中的粒子是在声学上独特的并是独立完整的。

14.根据权利要求1所述的方法,其中粒子出现的可预见性必须高。

15.根据权利要求1所述的方法,其中各粒子具有将本粒子和其它粒子相区分的区别性声学结构,并且相同的粒子的不同实例之间具有相对低的声学可变性。

16.根据权利要求1所述的方法,其中个别粒子出现的可预见性相对较高。

17.根据权利要求1所述的方法,其中所述粒子集合是人工确定的。

18.根据权利要求1所述的方法,其中所述粒子集合是试探性地确定的。

19.根据权利要求1所述的方法,所述方法还包括如下步骤:

使用训练文献构建粒子集合和同时优化的基于粒子的语言模型,其中所述基于粒子的语言模型的复杂度实质性地低于根据相同的训练文献构建的基于字词的语言模型的复杂度。

20.根据权利要求19所述的方法,其中所述粒子集合对目标函数应用期望值最大,其中所述目标函数考虑下面的任意组合:

粒子集合的大小;

在展现文献训练集合和查询训练集合中的所有文献时的错误;

使用粒子集合的检索的准确度;

表示粒子集合的统计模型的熵;以及

从训练集合中的文献和查询得到的粒子级别的语言模型。

21.根据权利要求1所述的方法,其中首先将各文献中的各字词转换为表示该字词的所有可能的发音的语音图表,并接着将所述语音图表转换为所述文献粒子集合。

22.根据权利要求1所述的方法,所述方法还包括:

对所述相关文献进行排位。

23.根据权利要求20所述的方法,其中所述基于粒子的语言模型的复杂度至少比基于字词的语言模型的复杂度低十倍。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200980105767.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top