[发明专利]一种文本答案的确定方法、装置、设备和介质有效
申请号: | 202210745454.6 | 申请日: | 2022-06-29 |
公开(公告)号: | CN114817513B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 尹文枫;董刚;赵雅倩;李仁刚 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘颖 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 答案 确定 方法 装置 设备 介质 | ||
本申请涉及深度学习技术领域,公开了一种文本答案的确定方法、装置、设备和介质,获取包括文章文本和问题文本的待分析文本。基于待分析文本与设定的偏移量的相似度,确定出与待分析文本匹配的目标偏移量;依据目标偏移量,对神经网络模型以及待分析文本进行压缩处理。利用压缩后的神经网络模型对压缩后的待分析文本进行分析,以从文章文本中提取出与问题文本匹配的答案。基于待分析文本的文本特征选取匹配的偏移量,利用偏移量实现对神经网络模型以及待分析文本的压缩,减少了所需分析的文本数据量和神经网络模型的计算量,提升了文本的处理效率。根据不同类型的输入数据的特征灵活地选择偏移量,实现了神经网络模型的灵活调整和应用。
技术领域
本申请涉及深度学习技术领域,特别是涉及一种文本答案的确定方法、装置、设备和计算机可读存储介质。
背景技术
神经网络压缩技术能够减少神经网络的参数量并加速推理,解决神经网络过参数化对深度学习在资源受限场景或设备应用的阻碍。卷积神经网络(Convolutional NeuralNetworks,CNN)和循环神经网络(Recurrent Neural Network,RNN)是目前常使用的神经网络。
CNN对于输入数据的维度具有较为严格的约束,这个约束在图像识别方面具有较好的适配性,因此CNN常用于图像的分析处理。RNN更多的考虑了神经元之间的联系,比如训练一个翻译系统,那么对于一个短语的翻译一定要考虑前因后果,这就需要模型对于数据输入的前后因素都要考虑,因此RNN常用于文本的分析处理。
目前动态神经网络剪枝算法主要集中于CNN,缺乏面向RNN的动态剪枝方案。RNN通常包含十几层甚至几十层的网络,通常需要非常大的计算代价和存储空间。当采用未执行剪枝的RNN对文本进行分析处理时,需要对文本进行大量的运算分析才能输出结果,导致文本的处理效率偏低。
可见,如何提升文本的处理效率,是本领域技术人员需要解决的问题。
发明内容
本申请实施例的目的是提供一种文本答案的确定方法、装置、设备和计算机可读存储介质,可以快速准确的确定出文本答案。
为解决上述技术问题,本申请实施例提供一种文本答案的确定方法,包括:
获取待分析文本;其中,所述待分析文本包括文章文本和问题文本;
基于所述待分析文本与设定的偏移量的相似度,确定出与所述待分析文本匹配的目标偏移量;
依据所述目标偏移量,对神经网络模型以及所述待分析文本进行压缩处理;
利用压缩后的神经网络模型对压缩后的待分析文本进行分析,以从所述文章文本中提取出与所述问题文本匹配的答案。
可选地,所述基于所述待分析文本与设定的偏移量的相似度,确定出与所述待分析文本匹配的目标偏移量包括:
调用设定的决策模型对所述待分析文本进行处理,以得到各偏移量与所述待分析文本的匹配率;
基于各所述偏移量对应的匹配率、偏移量总个数以及设定的温度参数和随机变量,构建独热向量;
依据所述独热向量,从各所述偏移量中选取出与所述待分析文本匹配的目标偏移量。
可选地,所述基于各所述偏移量对应的匹配率、偏移量总个数以及设定的温度参数和随机变量,构建独热向量包括:
调用匹配率转化公式,将各所述偏移量对应的匹配率转化为独热向量;其中,所述匹配率转化公式的表达式为:
;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210745454.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种LDMOS晶体管及其制作方法
- 下一篇:一种用于骨科假体固定的植入结构