[发明专利]一种社区问答搜索中的查询补全方法有效
申请号: | 201510745059.8 | 申请日: | 2015-11-05 |
公开(公告)号: | CN105447080B | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 黄河燕;毛先领;梅莉莉;黄静 | 申请(专利权)人: | 华建宇通科技(北京)有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种社区问答搜索中的查询补全方法,属于信息检索技术领域;包括以下步骤:一、构建cQA数据库;二、构建实体词典和词组词典;三、对于用户输入的查询语句,判断最后一个单词是否完整,若不完整,进行末尾单词补全;四、对查询语句通过采用排序函数对数据库中的问题进行排序得到初始候选问题列表;五、对列表根据发散性、大小适度、局部保序性和保真性要求进行筛选;六、按照候选问题的重要性和质量进行再排序;七、输出再排序后的前N条候选问题供用户选择。与现有技术相比,本发明可以在缺少用户搜索日志时进行查询补全,克服了现有方法中推荐相似问题、尺寸不符、相对顺序不变、失真的问题,用户体验上优于现有搜索引擎的使用效果。 | ||
搜索关键词: | 一种 社区 问答 搜索 中的 查询 方法 | ||
【主权项】:
1.一种社区问答搜索中的查询补全方法,其特征在于:步骤一、基于问答语料构建由问答对组成的cQA数据库;步骤二、基于现有百科知识资源和词典资源构建实体词典和词组词典;步骤三、对于用户输入的查询语句,判断查询语句的最后一个单词是否完整,若末尾单词不完整,转步骤四;否则,转步骤五;步骤四、对输入的查询语句进行末尾单词补全得到完整的查询语句;步骤五、对查询语句通过采用排序函数对数据库中的问题进行排序得到初始的供用户选择的候选问题列表;步骤六、对步骤四得到的初始候选问题列表根据发散性、大小适度、局部保序性和保真性的要求进行筛选;步骤七、对筛选后的候选问题列表按照候选问题的重要性和质量从高到低的顺序进行再排序;步骤八、输出再排序后的前N条候选问题供用户选择;为了提高检索效果,步骤五所述排序函数中采用了线性插值平滑的方法和统计翻译的模型,具体如下:p(w|(q,a))=(1‑λ)pmx(w|(q,a))+λpml(w|C) (2)其中,q是用户的查询语句,w是查询语句中的每一个单词,C={(q,a)1,(q,a)2,...,(q,a)L}表示cQA数据库中的问答对,(q,a)i是第i个问答对,q表示问题,a表示答案;λ是平滑参数,pml(w|C)表示给定C,词w的条件概率;pml(w|q)表示给定问题q,词w的条件概率;p(w|t)表示给定问题中的单词t,词w的条件概率;pml(t|q)表示给定问题q,单词t的条件概率;pml(w|a)表示给定答案a,单词w的条件概率;且满足α+β+γ=1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华建宇通科技(北京)有限责任公司,未经华建宇通科技(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510745059.8/,转载请声明来源钻瓜专利网。
- 上一篇:日志结构化信息提取方法及装置
- 下一篇:文本渲染方法和系统