[发明专利]参考文档的推荐方法及装置在审
申请号: | 201510849040.8 | 申请日: | 2015-11-27 |
公开(公告)号: | CN105488151A | 公开(公告)日: | 2016-04-13 |
发明(设计)人: | 陈志军;张涛;汪平仄 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 滕一斌 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参考 文档 推荐 方法 装置 | ||
1.一种参考文档的推荐方法,其特征在于,包括:
获取用户正在操作的目标文档的内容信息;
根据预设解析规则,对所述内容信息进行解析;
对解析后得到的关键信息进行筛选处理,以从所述关键信息中提取出检索词;
基于所述检索词进行检索,得到包含所述检索词的参考文档;
将所述参考文档进行显示。
2.根据权利要求1所述的方法,其特征在于,所述预设解析规则包括:标志内容提 取规则、分词规则;所述根据预设解析规则,对所述内容信息进行解析,包括:
根据所述标志内容提取规则,提取所述内容信息中的标志内容;所述标志内容包括以 下至少一项:所述目标文档中指明的关键词、所述目标文档标题;
根据所述分词规则对提取所述标志内容后的内容信息进行分词处理,得到分词处理后 的各个词语片断。
3.根据权利要求2所述的方法,其特征在于,所述关键信息包括:所述标志内容、 所述词语片断;相应的,所述对解析后得到的关键信息进行筛选处理,以从所述关键信息 中提取出检索词包括:
将各个所述词语片断中的不相关词语删除;所述不相关词语包括以下一种或多种:连 接词语、单字词语、称谓词语;
对删除处理后剩余的各个词语片断进行重复出现频度排序;
根据频度由大到小的顺序,从排序第一位的词语片断开始选出满足预设阈值个数的词 语片断,并在所述选出的词语片断中去除与所述标志内容一致的词语片断,得到筛选后的 词语片断;所述筛选后的词语片断与所述标志内容构成所述检索词。
4.根据权利要求1所述的方法,其特征在于,所述基于所述检索词进行检索,得到 包含所述检索词的参考文档,包括:
将所述检索词导入搜索库中进行检索,得到包含所述检索词的参考文档;所述搜索库 包含以下一种或多种:本地存储介质、用户预设的云存储设备、公共搜索引擎资源。
5.根据权利要求1所述的方法,其特征在于,还包括:所述基于所述检索词进行检 索之后,
根据预设评价规则,对检索得到的文档进行评价处理;所述评价规则包括以下一种或 多种:被引用次数因子、文档好评率、文档质量程度。
相应的,所述得到包含检索词的参考文档包括:
根据所述评价处理结果对检索得到的所述参考文档进行优先级排序,以使所述参考文 档具有优先级顺序。
6.根据权利要求1所述的方法,其特征在于,还包括:所述对解析后得到的关键信 息进行筛选处理,以从所述关键信息中提取出检索词之后,
根据所述检索词在所述目标文档中所处位置与用户当前输入字符位置之间的距离,或 者根据所述检索词在所述目标文档中的权重值,对所述检索词进行优先级排序;
相应的,所述基于所述检索词进行检索,包括:
基于排序得到的所述检索词的优先级顺序进行检索。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述目标文档进行语义理解分析,获取所述目标文档的主题属性;
相应的,所述得到与所述目标文档相似的参考文档之后,还包括:
根据所述主题属性对所述参考文档进行排序,将与所述主题属性匹配度高的参考文档 进行优先显示。
8.根据权利要求1所述的方法,其特征在于,所述将所述参考文档进行显示包括:
所述参考文档与所述目标文档位于同一显示窗口内显示,或者所述参考文档与所述目 标文档位于不同显示窗口内显示。
9.根据权利要求8所述的方法,其特征在于,所述参考文档与所述目标文档位于同 一显示窗口内包括:
所述参考文档与所述目标文档分栏显示,所述参考文档位于所述显示窗口的任意一 侧;或者,所述参考文档以浮窗形式覆盖显示于所述目标文档表面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510849040.8/1.html,转载请声明来源钻瓜专利网。