[发明专利]FAQ问答对自动构建方法、装置、计算机设备及存储介质有效
申请号: | 201910969443.4 | 申请日: | 2019-10-12 |
公开(公告)号: | CN111046152B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 杨凤鑫;徐国强 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/84;G06F40/205;G06F40/211;G06F40/126;G06N3/0455;G06N3/0464;G06N3/0499;G06N3/08 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | faq 答对 自动 构建 方法 装置 计算机 设备 存储 介质 | ||
1.一种FAQ问答对自动构建方法,其特征在于,包括:
获取待阅读的文档;
对所述待阅读的文档采用层叠CRF模型进行解析以得到XML文档;
通过预设分段方式对所述XML文档进行分段,以得到具有预设文档结构的文档作为目标文档,其中,所述预设分段方式包括一级标题分段、二级标题分段以及文章段落分段;
根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落,其中,所述预设的筛选模型为Bert模型;
根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对;
其中,所述根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对,包括:
对所述目标段落及所述待回答问题分别采用预设的模型进行编码以得到第二段落文本向量及问题文本向量,其中,所述预设的模型为Bert模型和EncoderBlock模型,所述第二段落文本向量及问题文本向量为三维向量;
对所述第二段落文本向量及所述问题文本向量进行编码以得到新文本向量,其中,所述新文本向量为所述三维向量,所述三维向量中的第一分量、第二分量以及第三分量分别为Batch_Size、句子长度以及每个词对应的维度;
根据预设的提取模型对所述新文本向量进行编码以得到目标文本向量;
对所述目标文本向量进行计算以得到所述待回答问题的答案开始及结束的位置,从而生成所述FAQ问答对;
2.根据权利要求1所述的方法,其特征在于,所述根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落,包括:
根据所述待回答问题及预设的所述筛选模型对所述目标文档进行编码以得到第一段落文本向量;
根据所述待回答问题计算每个所述第一段落文本向量与所述待回答问题相匹配的概率;
将概率最大的所述第一段落文本向量所对应的段落确定为与所述待回答问题相匹配的段落,并作为目标段落;
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对之后,还包括:
获取所述FAQ问答对并将获取的所述FAQ问答对反馈给用户;
4.根据权利要求3所述的方法,其特征在于,所述获取所述FAQ问答对并将获取的所述FAQ问答对反馈给用户之后,还包括:
判断是否接收到用户发送的修改指令;
若接收到用户发送的所述修改指令,则将所述修改指令中由用户所输入的问题作为所述待回答问题;
返回执行所述根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落的步骤;
5.根据权利要求4所述的方法,其特征在于,所述判断是否接收到用户发送的修改指令之后,还包括:
若未接收到用户发送的所述修改指令,则判断所述待回答问题是否为预设数据库问题模板中的问题;
若所述待回答问题不是预设数据库问题模板中的问题,则根据所述待回答问题更新所述预设数据库问题模板中的问题;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910969443.4/1.html,转载请声明来源钻瓜专利网。