[发明专利]一种词与词之间的相关度算法在审
申请号: | 201310040098.9 | 申请日: | 2013-02-01 |
公开(公告)号: | CN103970789A | 公开(公告)日: | 2014-08-06 |
发明(设计)人: | 尹科 | 申请(专利权)人: | 北京英富森信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100190 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 之间 相关 算法 | ||
1.一种词与词之间的相关度算法,其特征在于,包括以下步骤:
按数据库中所有记录文献的相关度值及相关距离值生成由所述所有记录文献的所有关键词构成的关键词网;
用户输入检索词后,在所述关键词网中查找其关键词包含所述检索词的记录文献,并按所述检索词与所述关键词相关度大小顺序将包含所述关键词的记录文献名输出。
2.根据权利要求1所述一种词与词之间的相关度算法,其特征在于,所述关键词网的生成步骤如下:
依据公式:记录文献A与记录文献B的相关度值=记录文献A与记录B的关键词重复个数的平方÷记录文献A的关键词数量×记录文献A的关键词数量,计算所述数据库中每篇记录文献与其它记录文献的相关度值:
依据公式:记录文献A与记录B的距离=1-记录文献A与记录文献B的相关度值,计算所述数据库中每篇记录文献与其它记录文献的相关距离值;
根据所述数据库中每篇记录文献与其它记录文献的相关距离值形成以所述所有记录文献的关键词为节点的包含N层关键词节点的关键词网。
3.根据权利要求2所述一种词与词之间的相关度算法,其特征在于,所述每篇记录文献与其它记录文献的所述相关距离值为所述关键词网中各所述关键词节点间的距离。
4.根据权利要求3所述一种词与词之间的相关度算法,其特征在于,所述在所述关键词网中查找关键词包含所述检索词的记录文献,并按所述检索词与所述关键词相关度大小顺序将包含所述关键词的记录文献名输出的步骤如下:
计算所述检索词与包含所述检索词的关键词的相关度值;
按所述相关度值的大小顺序将包含所述关键词的记录文献输出;
计算公式如下:
检索词与关键词的相关度值=N层关键词节点距离的平均值×关键词出现次数的平方根。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京英富森信息技术有限公司,未经北京英富森信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310040098.9/1.html,转载请声明来源钻瓜专利网。