[发明专利]基于排序学习的自动问答装置及方法有效
申请号: | 201510007539.4 | 申请日: | 2015-01-07 |
公开(公告)号: | CN104573000B | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 薛锐青 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙)11447 | 代理人: | 南毅宁,桑传标 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于排序学习的自动问答装置及方法。该方法包括构建问答库,该问答库包括多个预设查询和与每个预设查询一一对应的问答集;根据问答库中包括的预设查询和问答集,为每个预设查询构建训练样本,并对训练样本进行正负例标注;根据每个预设查询的训练样本、以及每个预设查询的训练样本的正负例标注,为每个预设查询构建排序训练数据;利用所构建的所有排序训练数据进行排序学习,得出针对问答库的问答排序模型;接收用户查询,并根据用户查询从问答库中筛选与用户查询有关的候选问答集;以及利用问答排序模型对候选问答集进行排序。通过排序学习过程,可以自动拟合出特征权值,无需人工参与,且使问答排序模型更为可靠和准确。 | ||
搜索关键词: | 基于 排序 学习 自动 问答 装置 方法 | ||
【主权项】:
一种基于排序学习的自动问答方法,其特征在于,该方法包括:步骤a:构建问答库,该问答库包括多个预设查询和与每个预设查询一一对应的问答集;步骤b:根据所述问答库中包括的所述预设查询和所述问答集,为每个预设查询构建训练样本,并对所述训练样本进行正负例标注;步骤c:根据每个预设查询的训练样本、以及每个预设查询的训练样本的正负例标注,为每个预设查询构建排序训练数据;步骤d:利用所构建的所有排序训练数据进行排序学习,得出针对所述问答库的问答排序模型;步骤e:接收用户查询,并根据所述用户查询从所述问答库中筛选与所述用户查询有关的候选问答集;以及步骤f:利用所述问答排序模型对所述候选问答集进行排序;其中,在所述步骤b中,通过以下方式为每个预设查询构建训练样本,并对所述训练样本进行正负例标注:针对每个预设查询,将该预设查询与和其对应的问答集构建为针对该预设查询的训练样本,并将该训练样本标注为正例;针对每个预设查询,从所述问答库中确定与该预设查询有关的候选问答集,该候选问答集包括与该预设查询相对应的问答集和若干其他问答集,将该预设查询与所述若干其他问答集一一构建为针对该预设查询的训练样本,并将该训练样本标注为负例。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510007539.4/,转载请声明来源钻瓜专利网。
- 上一篇:可收缩步长的多类别集成学习分类方法
- 下一篇:一种压缩文件的解压方法和装置