[发明专利]一种提供聚合类型回答的方法和装置有效
申请号: | 201510975343.4 | 申请日: | 2015-12-22 |
公开(公告)号: | CN105608183B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 郑思晴 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天达知识产权代理事务所(普通合伙) 11386 | 代理人: | 张春;马东伟 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提供 聚合 类型 回答 方法 装置 | ||
本发明提供了一种提供聚合类型的智能回答的方法和装置,所述方法根据接收到的查询词,获取与所述查询词对应的聚合问题;在知识库中获取与所述聚合问题所对应的聚合答案数据;输出所述聚合问题所对应的所述回答数据。该方法可以缩短用户信息寻找路径,改善用户的体验,使得用户界面更加友好。此外,本发明的技术方案还能够有效的提高信息获取效率,将原来需要多次劳动才能得到的结论通过聚合方式进行集成综合处理,从而大大简化了用户的操作。
技术领域
本发明涉及互联网技术领域,尤其涉及一种提供聚合类型回答的方法和装置。
背景技术
随着互联网技术的不断发展,用户对于互联网信息的需求越来越高,搜索引擎成为用户获取互联网信息的重要工具。用户在搜索引擎对应应用的搜索框中输入查询词,即搜索关键词,由应用将搜索关键词发送给搜索引擎;而搜索引擎根据搜索关键词,在数据库中进行搜索,将获取与搜索关键词匹配的资源作为若干个搜索结果项,返回给应用进行输出。
现有技术中,如果用户想要通过搜索关键词获取问答查询的查询结果,由于原始知识库中的资源都是相互独立的单一资源,使得每个搜索结果项也是单一内容,使得用户需要逐个点开多个搜索结果项,以获取一个综合性认知结论,无法快速满足用户真正的搜索意图。除了个别与第三方网站有合作的站点可以提供建议答案外,对于绝大多数问答查询,结果中都只有自然结果的罗列。用户需要点击普通自然结果进入相应落地页,在落地页中再去寻找需要的内容。
现有技术的存在如下缺陷:1)用户从搜索行为到最终找到想要的内容,由于点击-跳出-再点击的成本很高,导致用户操作不便且耗时较长,体验不佳;2)信息获取效率偏低;3)会增加应用与搜索引擎之间的数据交互,从而增加了搜索引擎的处理负担。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种提供聚合类型的智能回答的方法和装置。
根据本发明的一个方面,提供了一种提供聚合类型的智能回答的方法,包括:
根据接收到的查询词,获取与所述查询词对应的聚合问题;
在知识库中获取与所述聚合问题所对应的聚合答案数据;
输出所述聚合问题对应的所述聚合答案数据。
进一步的,所述知识库为问答对,即聚合问题-聚合答案资源对。
进一步的,所述根据接收到的查询词,获取与所述查询词对应的聚合问题,包括:
基于语义的匹配方式,获取与所述查询词匹配的聚合问题。
进一步的,还包括:
对问题类查询词进行基于语义的聚合处理,以获取聚合问题;
获取聚合问题的历史查询语句对应的历史库搜索结果中的网页;
根据预设规则确定上述网页中用于建立知识库的多个网页;
确定所述多个网页中包含的至少一组答案类数据;
基于所确定的答案类数据进行聚合,生成知识库。
进一步的,所述根据预设规则确定用于建立知识库的多个网页,包括:
根据历史搜索结果中的网页的站点的比例及站点类型确定哪些站点的网页用于建立知识库库。
进一步的,所述确定所述多个网页中包含的至少一组答案类数据,包括:
分析所述用于建立数据库的多个网页的页面数据,得到所述多个网页中包含的至少一组问答类数据;
抽取所得到的问答类数据中包含的答案类数据。
进一步的,所述抽取所得到的问答类数据中包含的答案类数据,包括
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510975343.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:苯并呋喃杀寄生物剂
- 下一篇:一种分布式大数据分析方法