[发明专利]文献归一方法、文献搜索方法及对应装置有效
申请号: | 201510888584.5 | 申请日: | 2015-12-07 |
公开(公告)号: | CN105447169B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 黄岳;马晋;张显;张晓婧;曹冰;徐学睿;李玉鹏;杰艺 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文献归一方法、文献搜索方法及对应装置,其中文献归一方法包括:获取一个以上网站来源的文献;对所获取的文献进行标准化;根据标准化后的文献的标题的相似度,将相似标题的文献进行聚类得到多个文献集合;在每个文献集合中计算文献的相似度,根据所计算的文献的相似度筛选出符合条件的文献集合;对筛选出的符合条件的文献集合,进行相同文献的聚类,并将相同的文献的发表来源进行汇总。文献搜索方法包括:接收用户输入的关键词;根据所述关键词,搜索出与所述关键词相关联的文献;在搜索结果中,将相同文献进行聚合展现,并展现各文献的发表来源。与现有技术相比,本发明实现相同文献的归一化,为提高文献搜索的效果提供基础。 | ||
搜索关键词: | 文献 方法 搜索 对应 装置 | ||
【主权项】:
1.一种文献归一方法,其特征在于,包括:获取一个以上网站来源的文献;对所获取的文献的文献属性进行标准化;根据标准化后的文献的标题的相似度,将相似标题的文献进行聚类得到多个文献集合;在每一个文献集合中,根据预先设置的各文献属性所对应的权重,计算每个文献集合中各文献间的相似度,将各文献间的相似度大于预设总分的文献集合确定为符合条件的文献集合;对筛选出的符合条件的文献集合,进行相同文献的聚类,并将相同的文献的发表来源进行汇总。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510888584.5/,转载请声明来源钻瓜专利网。
- 上一篇:数据缓存方法与装置
- 下一篇:一种在线信息咨询检索系统