[发明专利]基于深度学习的答案抽取方法、装置和存储介质在审
申请号: | 201910225135.0 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109977404A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 杨雪峰;徐爽;巨颖;孙宁远 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332;G06Q30/02 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 涂凤琴 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户问题 文档内容 抽取 答案 存储介质 学习 答案提取 匹配规则 提取特征 自动客服 匹配 申请 展示 制定 | ||
1.一种基于深度学习的答案抽取方法,其特征在于,包括:
获取用户问题,以及,根据所述用户问题获取与所述用户问题相关的文档内容;
基于深度学习模型,在所述文档内容中确定抽取起始位置和抽取结束位置;
将所述抽取起始位置和所述抽取结束位置之间的文档内容,确定为所述用户问题所对应的答案,并展示所述答案。
2.根据权利要求1所述的方法,其特征在于,所述基于深度学习模型,在所述文档内容中确定抽取起始位置和抽取结束位置,包括:
根据所述用户问题和所述文档内容分别得到待处理的用户问题和待处理的文档内容,分别对所述待处理的用户问题和所述待处理的文档内容进行分词,并对各个词进行词向量转换,得到第一问题矩阵和第一文档矩阵;
对所述第一文档矩阵进行处理,使得处理后的第一文档矩阵包含问题信息,以及,对所述处理后的第一文档矩阵和所述第一问题矩阵分别进行编码,分别得到第二文档矩阵和第二问题矩阵;
基于注意力机制,对所述第二文档矩阵和所述第二问题矩阵进行交互处理,得到第三文档矩阵;
基于注意力机制,对所述第三文档矩阵进行自匹配处理,得到第四文档矩阵;
基于指针网络,根据所述第四文档矩阵和所述第二问题矩阵,在所述文档内容中确定抽取起始位置和抽取结束位置。
3.根据权利要求2所述的方法,其特征在于,所述根据所述用户问题和所述文档内容分别得到待处理的用户问题和待处理的文档内容,包括:
对所有所述文档内容进行拼接,得到待处理的文档内容;和/或,
对所述用户问题重复多次,并对重复的用户问题进行拼接,得到待处理的用户问题,其中,所述用户问题重复的次数为所述文档内容的总个数。
4.根据权利要求2所述的方法,其特征在于,所述对所述第一文档矩阵进行处理,使得处理后的第一文档矩阵包含问题信息,包括:
确定词共现特征,并将所述词共现特征拼接到所述第一文档矩阵中的相应文档词向量的尾部,得到处理后的第一文档矩阵。
5.根据权利要求4所述的方法,其特征在于,所述词共现特征包括:第一词共现特征和/或第二词共现特征,所述确定词共现特征,并将所述词共现特征拼接到所述第一文档矩阵中的相应文档词向量的尾部,包括:
对应所述待处理的文档内容中的每个词,如果所述词与待处理的用户问题中的至少一个词相同,则确定所述待处理的文档内容中所述词对应的第一词共现特征为第一值,否则,确定第一词共现特征为第二值,其中,所述第一值和所述第二值均为固定值,分别用于表示文档内容中的词在所述用户问题中出现或不出现,以及,将所述第一词共现特征拼接到所述第一文档矩阵中所述词所对应的词向量的尾部;和/或,
分别计算所述第一文档矩阵中的各个词向量与所述第一问题矩阵中的各个词向量之间的相似度数值,以及,对应所述第一文档矩阵中的每个词向量,对所述相似度数值进行归一化,将归一化后的相似度数值作为第二词共现特征,拼接到所述第一文档矩阵中的相应词向量的尾部。
6.根据权利要求2所述的方法,其特征在于,所述对所述处理后的第一文档矩阵和所述第一问题矩阵分别进行编码,分别得到第二文档矩阵和第二问题矩阵,包括:
以所述处理后的第一文档矩阵作为预设的第一GRU网络的输入,采用所述第一GRU网络对所述处理后的第一文档矩阵进行处理,将所述第一GRU网络的输出层输出确定为第二文档矩阵;以及,
根据所述第一问题矩阵确定输入问题矩阵,将所述输入问题矩阵作为预设的第二GRU网络的输入,采用所述第二GRU网络对所述输入问题矩阵进行处理,将所述第二GRU网络的输出层输出确定为第二问题矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910225135.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:恶意评论信息识别方法及装置
- 下一篇:一种智能语义匹配方法