[发明专利]一种社区问答搜索中的查询补全方法有效

专利信息
申请号: 201510745059.8 申请日: 2015-11-05
公开(公告)号: CN105447080B 公开(公告)日: 2018-10-26
发明(设计)人: 黄河燕;毛先领;梅莉莉;黄静 申请(专利权)人: 华建宇通科技(北京)有限责任公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100083 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种社区问答搜索中的查询补全方法,属于信息检索技术领域;包括以下步骤:一、构建cQA数据库;二、构建实体词典和词组词典;三、对于用户输入的查询语句,判断最后一个单词是否完整,若不完整,进行末尾单词补全;四、对查询语句通过采用排序函数对数据库中的问题进行排序得到初始候选问题列表;五、对列表根据发散性、大小适度、局部保序性和保真性要求进行筛选;六、按照候选问题的重要性和质量进行再排序;七、输出再排序后的前N条候选问题供用户选择。与现有技术相比,本发明可以在缺少用户搜索日志时进行查询补全,克服了现有方法中推荐相似问题、尺寸不符、相对顺序不变、失真的问题,用户体验上优于现有搜索引擎的使用效果。
搜索关键词: 一种 社区 问答 搜索 中的 查询 方法
【主权项】:
1.一种社区问答搜索中的查询补全方法,其特征在于:步骤一、基于问答语料构建由问答对组成的cQA数据库;步骤二、基于现有百科知识资源和词典资源构建实体词典和词组词典;步骤三、对于用户输入的查询语句,判断查询语句的最后一个单词是否完整,若末尾单词不完整,转步骤四;否则,转步骤五;步骤四、对输入的查询语句进行末尾单词补全得到完整的查询语句;步骤五、对查询语句通过采用排序函数对数据库中的问题进行排序得到初始的供用户选择的候选问题列表;步骤六、对步骤四得到的初始候选问题列表根据发散性、大小适度、局部保序性和保真性的要求进行筛选;步骤七、对筛选后的候选问题列表按照候选问题的重要性和质量从高到低的顺序进行再排序;步骤八、输出再排序后的前N条候选问题供用户选择;为了提高检索效果,步骤五所述排序函数中采用了线性插值平滑的方法和统计翻译的模型,具体如下:p(w|(q,a))=(1‑λ)pmx(w|(q,a))+λpml(w|C) (2)其中,q是用户的查询语句,w是查询语句中的每一个单词,C={(q,a)1,(q,a)2,...,(q,a)L}表示cQA数据库中的问答对,(q,a)i是第i个问答对,q表示问题,a表示答案;λ是平滑参数,pml(w|C)表示给定C,词w的条件概率;pml(w|q)表示给定问题q,词w的条件概率;p(w|t)表示给定问题中的单词t,词w的条件概率;pml(t|q)表示给定问题q,单词t的条件概率;pml(w|a)表示给定答案a,单词w的条件概率;且满足α+β+γ=1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华建宇通科技(北京)有限责任公司,未经华建宇通科技(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510745059.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top