[发明专利]基于命名实体的文本问答方法、装置及可读存储介质在审
申请号: | 202010434262.4 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111695354A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 郝新东;王科强 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/332;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 命名 实体 文本 问答 方法 装置 可读 存储 介质 | ||
1.一种基于命名实体的文本问答方法,其特征在于,所述方法包括:
接收用户输入的咨询文本,对所述咨询文本执行命名实体识别,得到实体文本集;
获取问答语料集,并对所述问答语料集执行命名实体识别及命名实体划分,得到多个问答语料子集;
从多个所述问答语料子集中提取与所述咨询文本相关的问答语料子集,组成回答文本集,并将所述回答文本集进行切分及编码操作,得到问答编码集;
将所述问答编码集输入至预训练完成的深度学习问答模型中,得到所述咨询文本的回答文本。
2.如权利要求1所述的基于命名实体的文本问答方法,其特征在于,所述将所述回答文本集进行切分及编码操作,得到问答编码集,包括:
根据预构建的切分词典,对所述回答文本集执行切分操作得到问答词组集;
对所述问答词组集执行所述编码操作得到问答编码集。
3.如权利要求2所述的基于命名实体的文本问答方法,其特征在于,所述根据预构建的切分词典,对所述回答文本集执行切分操作得到问答词组集,包括:
步骤Ⅰ:提取所述回答文本集内每个回答文本;
步骤Ⅱ:按照预设的切分规则,对所述回答文本进行切分得到回答切分词;
步骤Ⅲ:判断所述回答切分词在所述切分词典是否出现,若所述回答切分词在所述切分词典不出现,返回步骤Ⅱ;
步骤Ⅳ:若所述回答切分词在所述切分词典出现,继续对所述回答文本进行切分,直至所述回答文本集提取完成得到所述问答词组集。
4.如权利要求1所述的基于命名实体的文本问答方法,其特征在于,该方法还包括训练所述深度学习问答模型,其中所述训练包括:
步骤A:根据预先设定的网络组合权重函数,对多组长短期记忆网络进行组合得到待训练深度学习问答模型,并获取问答训练集和问答标签集,将所述问答训练集输入至所述待训练深度学习问答模型;
步骤B:计算每组长短期记忆网络之间的关联权重得到关联权重集;
步骤C:对所述关联权重集的进行加权求和及激活处理得到问答预测集;
步骤D:计算所述问答预测集和所述问答标签集的误差值,若所述误差值大于预设的误差阈值,根据预构建的优化函数,重新计算每组长短期记忆网络之间的关联权重得到关联权重集,并返回步骤C;
步骤E:若所述误差值小于或等于所述误差阈值,得到训练完成的所述深度学习问答模型。
5.如权利要求1至4中任意一项所述的基于命名实体的文本问答方法,其特征在于,所述对所述问答语料集执行命名实体识别及命名实体划分,得到多个问答语料子集,包括:
对所述问答语料集执行命名实体识别得到问答实体集;
根据所述问答实体集所包括的问答实体,对所述问答语料集进行文本划分得到多个所述问答语料子集。
6.一种基于命名实体的文本问答装置,其特征在于,所述装置包括:
实体文本计算模块,用于接收用户输入的咨询文本,对所述咨询文本执行命名实体识别,得到实体文本集;
问答语料计算模块,用于获取问答语料集,并对所述问答语料集执行命名实体识别及命名实体划分,得到多个问答语料子集;
编码模块,用于从多个所述问答语料子集中提取与所述咨询文本相关的问答语料子集,组成回答文本集,并将所述回答文本集进行切分及编码操作,得到问答编码集;
回答文本计算模块,用于将所述问答编码集输入至预训练完成的深度学习问答模型中,得到所述咨询文本的回答文本。
7.如权利要求6所述的基于命名实体的文本问答装置,其特征在于,所述装置还包括模型训练模块,用于:
根据预先设定的网络组合权重函数,对多组长短期记忆网络进行组合得到待训练深度学习问答模型,并获取问答训练集和问答标签集,将所述问答训练集输入至所述待训练深度学习问答模型;
计算每组长短期记忆网络之间的关联权重得到关联权重集;
对所述关联权重集的进行加权求和及激活处理得到问答预测集;
计算所述问答预测集和所述问答标签集的误差值;在所述误差值小于或等于预设的误差阈值时,得到训练完成的深度学习问答模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010434262.4/1.html,转载请声明来源钻瓜专利网。