[发明专利]一种基于哈希学习的问答系统构建方法有效
申请号: | 201910361175.8 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110110063B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 李武军;徐栋 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于哈希学习的问答系统构建方法,可以达到在线问答场景下模型精度高、内存开销低且响应时间短的效果。该方法首先根据问答系统的应用场景收集问答训练集,再结合深度学习技术构造端到端的问答系统网络模型,在训练集上通过机器学习优化算法训练模型。在系统部署前,通过答案收集算法收集答案知识库,使用训练好的问答系统网络模型计算答案知识库中答案的二值矩阵表示。在线部署时,对于收到的问题,首先使用问答系统网络模型进行问题编码,然后问答系统网络模型根据问题的编码和答案的二值矩阵表示计算问题和答案的匹配程度。最后根据答案知识库中的答案与问题的匹配程度对答案进行排序,将排在前面的答案作为响应返回给用户。 | ||
搜索关键词: | 一种 基于 学习 问答 系统 构建 方法 | ||
【主权项】:
1.一种基于哈希学习的问答系统构建方法,其特征在于,具体包括以下步骤:1)当有和问答系统应用场景相关的公开问答数据集或自己标注的问答数据集时,直接使用该数据集训练模型,当缺少训练数据时,从互联网数据中构造问答训练集;2)根据问答训练集,构建并训练问答系统网络模型;3)通过答案收集算法收集答案并构建答案知识库;4)使用问答系统网络模型计算答案知识库中答案的二值矩阵表示,建立答案二值矩阵表示数据库;5)对于问答系统接收到的问题,使用问答系统网络模型计算问题编码,然后问答系统网络模型根据问题编码和答案二值矩阵表示计算问题和答案的匹配程度,再基于匹配程度对答案进行排序;6)当答案知识库中没有合适的答案时,答案收集算法根据问题重新收集答案,然后使用问答系统网络模型计算其二值矩阵表示,更新到答案知识库和答案二值矩阵表示数据库中;7)根据答案排序的结果和系统要求做出响应。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910361175.8/,转载请声明来源钻瓜专利网。