[发明专利]获取搜索结果的方法和装置有效
申请号: | 201410594905.6 | 申请日: | 2014-10-29 |
公开(公告)号: | CN104298658B | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 吴文权;吴先超;刘占一 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 搜索 结果 方法 装置 | ||
1.一种获取搜索结果的方法,其特征在于,包括:
接收要搜索的问题;
对所述问题进行句法语义分析,得到句法语义分析后的问题;
获取预先建立的知识库中的知识内容,所述知识内容包括对原始文本数据进行句法语义分析后得到的文本数据,所述原始文本数据为互联网数据;
根据所述句法语义分析后的问题和所述知识内容,得到与所述问题对应的答案,并将所述答案确定为搜索结果;
所述句法语义分析包括:句法分析和语义角色标注;
所述语义角色标注包括:
谓语识别;
谓语语义分类;以及,
谓语的论元识别和角色判定;
其中,所述根据所述句法语义分析后的问题和所述知识内容,得到与所述问题对应的答案,包括:
对所述句法语义分析后的问题进行分析,根据分析结果将所述问题分解为至少两个子问题,在所述知识内容中搜索得到与所述子问题对应的子答案,对所述子答案进行合成,将合成后的答案确定为所述问题对应的答案;
其中,所述对所述句法语义分析后的问题进行分析,包括:对所述句法语义分析后的问题进行意图分析和LAT分析。
2.根据权利要求1所述的方法,其特征在于,所述接收要搜索的问题之前,所述方法还包括:建立所述知识库,所述建立所述知识库,包括:
收集原始文本数据;
对所述原始文本数据进行基础处理,得到基础处理后的文本数据,其中,所述基础处理包括分词、词性标注、专名识别和归一化处理;
对所述基础处理后的文本数据进行句法语义分析,得到句法语义分析后的文本数据;
对所述句法语义分析后的文本数据进行知识计算,得到知识内容,其中,所述知识计算包括关系识别、指代消解和关系推理;
将所述知识内容保存到知识库中。
3.根据权利要求1所述的方法,其特征在于,所述句法分析是依存分析。
4.一种获取搜索结果的装置,其特征在于,包括:
接收模块,用于接收要搜索的问题;
分析模块,用于对所述问题进行句法语义分析,得到句法语义分析后的问题;
获取模块,用于获取预先建立的知识库中的知识内容,所述知识内容包括对原始文本数据进行句法语义分析后得到的文本数据,所述原始文本数据为互联网数据;
确定模块,用于根据所述句法语义分析后的问题和所述知识内容,得到与所述问题对应的答案,并将所述答案确定为搜索结果;
所述分析模块具体用于:
对所述问题进行依存分析;
对依存分析后的问题进行谓语识别,谓语语义分类,以及,谓语的论元识别和角色判定,得到句法语义分析后的问题;
其中,所述确定模块具体用于:
对所述句法语义分析后的问题进行分析,根据分析结果将所述问题分解为至少两个子问题,在所述知识内容中搜索得到与所述子问题对应的子答案,对所述子答案进行合成,将合成后的答案确定为所述问题对应的答案;
所述对所述句法语义分析后的问题进行分析包括:对所述句法语义分析后的问题进行意图分析和LAT分析。
5.根据权利要求4所述的装置,其特征在于,还包括:
收集模块,用于收集原始文本数据;
第一处理模块,用于对所述原始文本数据进行基础处理,得到基础处理后的文本数据,其中,所述基础处理包括分词、词性标注、专名识别和归一化处理;
第二处理模块,用于对所述基础处理后的文本数据进行句法语义分析,得到句法语义分析后的文本数据;
第三处理模块,用于对所述句法语义分析后的文本数据进行知识计算,得到知识内容,其中,所述知识计算包括关系识别、指代消解和关系推理;
保存模块,用于将所述知识内容保存到知识库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410594905.6/1.html,转载请声明来源钻瓜专利网。