[发明专利]基于深度问答的查询结果的展现方法和装置有效
申请号: | 201611224370.9 | 申请日: | 2016-12-27 |
公开(公告)号: | CN106777236B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 陈雁峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/338;G06F16/35 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 问答 查询 结果 展现 方法 装置 | ||
1.一种基于深度问答的查询结果的展现方法,其特征在于,包括:
接收查询,所述查询为预设领域的预设类型的查询;
获取与所述查询对应的聚合结果的短观点,每个聚合结果根据同一个观点簇内的观点句所在的网页聚合得到,聚合结果的短观点根据对应的观点簇内的观点句得到;
展现所述聚合结果的短观点;
其中,所述获取与所述查询对应的聚合结果的短观点,包括:
对接收的查询进行识别,判断所述查询是否为预设领域的预设类型的查询;
在所述查询为预设领域的预设类型的查询时,执行如下内容:
在预先建立的网页资源库中获取与所述查询对应的网页;
在所述网页中抽取观点句;
对所述观点句进行聚合和归一化,得到观点簇及其短观点;
对所述观点簇进行簇外和簇内排序和选择,得到选择后的观点簇和选择后的观点簇内的观点句所在的网页,以及,将每个选择后的观点簇内的观点句所在的网页聚合成一个聚合结果,并将每个选择后的观点簇的短观点确定为对应的聚合结果的短观点;
其中,所述在所述网页中抽取观点句,包括:
对所述网页进行分句,得到所述网页中的句子;
如果所述句子为短句,则基于机器学习判断所述短句是否为观点句;
如果所述短句为观点句,则将所述短句作为所述网页中的观点句;
其中,所述基于机器学习判断所述短句是否为观点句包括:
提取所述短句的特征;
将所述短句的特征输入到预先建立的与所述查询所属类型对应的分类器中,获取所述短句的置信度;
如果所述置信度大于预设值,则确定所述短句为观点句;
其中,与所属述查询所类型对应的分类器是通过收集与所属述查询所类型对应的答案句子,并对所述答案句子进行是否为观点句的标注,并提取所述答案句子的特征,依据提取的特征和标注结果进行训练得到的;
其中,所述对所述观点句进行聚合和归一化,得到观点簇及其短观点,包括:
计算观点句之间的相似度,并根据相似度对观点句进行聚类,得到多个类;确定每个类的关键词,并对关键词相同的类进行合并,将合并后的每个类作为一个观点簇;
对观点簇内的观点句进行归一化,得到观点簇的短观点。
2.根据权利要求1所述的方法,其特征在于,还包括:
接收到对聚合结果的选择指令后,展现选择的聚合结果对应的网页信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
在得到聚合结果后,根据聚合结果的短观点生成摘要信息,并对应所述聚合结果展现摘要信息。
4.根据权利要求1所述的方法,其特征在于,所述网页资源库包括:
通用网页资源库;以及,
所述预设领域的垂类网页资源库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611224370.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种评估不同数据源数据准确度的方法和装置
- 下一篇:一种表面缺陷的分析方法