[发明专利]文本特征提取模型的量化方法、装置、设备及存储介质有效
申请号: | 202011552423.6 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112686031B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 韦阳;熊鹰;王晓晖;王明轩;李磊 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/151 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 特征 提取 模型 量化 方法 装置 设备 存储 介质 | ||
1.一种文本特征提取模型的量化方法,其特征在于,包括:
在文本特征提取模型训练过程中,根据目标量化参数确定与所述目标量化参数对应的量化区间;其中,所述量化区间为对所述目标量化参数的部分浮点值进行截断的区间,所述目标量化参数中的部分浮点值处于所述量化区间内,所述目标量化参数中的另一部分浮点值处于所述量化区间外;
根据所述量化区间构建所述目标量化参数的浮点值与定点值的映射关系;其中,所述目标量化参数中小于所述量化区间左端点的浮点值映射为量化后的最小定点值,所述目标量化参数中大于所述量化区间右端点的浮点值映射为量化后的最大定点值;
基于所述映射关系对所述目标量化参数进行量化操作。
2.根据权利要求1所述的方法,其特征在于,根据目标量化参数确定与所述目标量化参数对应的量化区间,包括:
确定所述目标量化参数的数值分布特征;
基于所述数值分布特征确定与所述目标量化参数对应的量化区间。
3.根据权利要求2所述的方法,其特征在于,在基于所述数值分布特征确定与所述目标量化参数对应的量化区间之前,还包括:
获取预设截断比例阈值;
基于所述数值分布特征确定与所述目标量化参数对应的量化区间,包括:
基于所述预设截断比例阈值、所述目标量化参数的数据量及所述目标量化参数的数值分布特征,确定与所述量化参数对应的量化区间。
4.根据权利要求3所述的方法,其特征在于,基于所述预设截断比例阈值、所述目标量化参数的数据量及所述目标量化参数的数值分布特征,确定与所述量化参数对应的量化区间,包括:
基于所述预设截断比例阈值及所述目标量化参数的数据量确定截断数据量2N;其中,N为所述预设截断比例阈值及所述目标量化参数的数据量的乘积;
基于所述目标量化参数中第N+1个最小数值和第N+1个最大值,确定与所述量化参数对应的量化区间;其中,所述量化区间为[第N+1个最小数值,第N+1个最大值]。
5.根据权利要求1所述的方法,其特征在于,根据目标量化参数确定与所述目标量化参数对应的量化区间,包括:
确定目标量化参数的类型;
获取与所述目标量化参数的类型对应的预设区间,并将所述预设区间确定为与所述目标量化参数对应的量化区间。
6.根据权利要求1所述的方法,其特征在于,在根据所述量化区间构建所述目标量化参数的浮点值与定点值的映射关系之前,还包括:
对所述量化区间进行调整,以使所述目标量化参数的浮点值0.0量化后的定点值为0。
7.根据权利要求1所述的方法,其特征在于,在根据目标量化参数确定与所述目标量化参数对应的量化区间之前,还包括:
根据所述文本特征提取模型的网络层的运算操作或网络参数的类型确定目标量化参数。
8.根据权利要求7所述的方法,其特征在于,根据所述文本特征提取模型的网络层的运算操作确定目标量化参数,包括:
当所述文本特征提取模型的网络层的运算操作为乘积运算时,将用于乘积运算的输入对象确定为目标量化参数;
当所述文本特征提取模型的网络层的运算操作为归一化操作时,将归一化操作的输出对象确定为目标量化参数。
9.根据权利要求7所述的方法,其特征在于,所述网络参数的类型包括权重矩阵和网络偏差;
根据所述文本特征提取模型的网络参数的类型确定目标量化参数,包括:
当所述网络参数为所述文本特征提取模型的权重矩阵时,将所述权重矩阵确定为目标量化参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011552423.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超声波焊机
- 下一篇:一种可调节角度的电磁振动器