[发明专利]基于命名实体的文本问答方法、装置及可读存储介质在审
申请号: | 202010434262.4 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111695354A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 郝新东;王科强 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/332;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 命名 实体 文本 问答 方法 装置 可读 存储 介质 | ||
本发明涉及人工智能技术,揭露了一种基于命名实体的文本问答方法,包括:接收用户输入的咨询文本,对所述咨询文本执行命名实体识别得到实体文本集;获取问答语料集,并对所述问答语料集执行命名实体识别及命名实体划分,得到多个问答语料子集,从多个所述问答语料子集中提取与所述咨询文本相关的问答语料子集,组成回答文本集,并将所述回答文本集进行切分及编码操作,得到问答编码集,将所述问答编码集输入至预训练完成的深度学习问答模型中,得到所述咨询文本的回答文本。本发明还提出一种基于命名实体的文本问答装置、电子设备以及计算机可读存储介质。本发明可以解决文本回答过程计算量大,回答效果差的问题。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于命名实体的文本问答的方法、装置、电子设备及可读存储介质。
背景技术
随着近年大数据以及人工智能技术在各行各业的普及与发展,各行各业的智能场景层出不穷,其中问答系统为主要的智能场景代表。
目前问答系统主要有下述两种:一、以词向量转变方法为基础,先将用户输入文本转变为词向量,并计算与词库的文本向量在空间距离的大小,并选择空间距离最小的词库文本完成问答;二、以深度学习模型为基础完成问答。其中第一种以词向量转变方法为基础的问答系统,由于方法简单往往答非所问无法满足当前场景的要求,而第二种以深度学习模型为基础的问答系统虽然可满足当前场景的要求,但由于深度学习模型需要进行大量的数据计算,若多个用户同时使用问答系统时,由于计算量高,问答系统往往不能及时响应,时效性较差。
发明内容
本发明提供一种基于命名实体的文本问答方法、装置、电子设备及计算机可读存储介质,其主要目的解决文本回答过程计算量大,回答效果差的问题。
为实现上述目的,本发明提供的一种基于命名实体的文本问答方法,包括:
接收用户输入的咨询文本,对所述咨询文本执行命名实体识别得到实体文本集;
获取问答语料集,并对所述问答语料集执行命名实体识别及命名实体划分,得到多个问答语料子集;
从多个所述问答语料子集中提取与所述咨询文本相关的问答语料子集,组成回答文本集,并将所述回答文本集进行切分及编码操作,得到问答编码集;
将所述问答编码集输入至预训练完成的深度学习问答模型中,得到所述咨询文本的回答文本。
可选地,将所述回答文本集进行切分及编码操作,得到问答编码集,包括:
根据预构建的切分词典,对所述回答文本集执行切分操作得到问答词组集;
对所述问答词组集执行所述编码操作得到问答编码集。
可选地,根据预构建的切分词典,对所述回答文本集执行切分操作得到问答词组集,包括:
步骤Ⅰ:提取所述回答文本集内每个回答文本;
步骤Ⅱ:按照预设的切分规则,对所述回答文本进行切分得到回答切分词;
步骤Ⅲ:判断所述回答切分词在所述切分词典是否出现,若所述回答切分词在所述切分词典不出现,返回步骤Ⅱ;
步骤Ⅳ:若所述回答切分词在所述切分词典出现,继续对所述回答文本进行切分,直至所述回答文本集提取完成得到所述问答词组集。
可选地,该方法还包括训练所述深度学习问答模型,其中所述训练包括:
步骤A:根据预先设定的网络组合权重函数,对多组长短期记忆网络进行组合得到待训练深度学习问答模型,并获取问答训练集和问答标签集,将所述问答训练集输入至所述待训练深度学习问答模型;
步骤B:计算每组长短期记忆网络之间的关联权重得到关联权重集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010434262.4/2.html,转载请声明来源钻瓜专利网。