[发明专利]一种数据处理方法及装置在审
申请号: | 202010456999.6 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111797617A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 吴帅;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G10L15/06;G10L15/26 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,包括:
从零开始枚举预设位数的所有数字;
根据枚举的所有数字生成数字模型;
将所述数字模型转化为数字的有限状态图;
获取语法规则,并将所述语法规则转化为规则的有限状态图;
合并所述数字的有限状态图和规则的有限状态图,生成数字识别模型,以采用所述数字识别模型识别数字。
2.根据权利要求1所述的方法,其特征在于,所述根据枚举的所有数字生成数字模型,包括:
对枚举的所有数字进行分类,得到位数不同的多类数字;
根据所述位数不同的多类数字生成多个数字模型;
所述将所述数字模型转化为数字的有限状态图,包括:
将所述多个数字模型转化为多个数字的有限状态图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述位数不同的多类数字生成多个数字模型,包括:
根据所述位数不同的多类数字生成多个数值模型,和多个号码模型;
其中,所述数值模型具有对应的数量单位,所述号码模型具有对应的数量单位。
4.根据权利要求3所述的方法,其特征在于,所述将所述多个数字模型转化为多个数字的有限状态图,包括:
将所述多个数值模型转化为多个第一有限状态图,以及将所述多个号码模型转化为多个第二有限状态图。
5.根据权利要求2所述的方法,其特征在于,所述合并所述数字有限状态图和规则有限状态图,生成数字识别模型,包括:
分别合并所述多个数字的有限状态图和所述规则的有限状态图,生成多个数字识别模型。
6.根据权利要求5所述的方法,其特征在于,所述规则的有限状态图包括数字类别和数字长度,所述分别合并所述多个数字的有限状态图和所述规则的有限状态图,生成多个数字识别模型,包括:
遍历查找所述规则的有限状态图中的数字类别,及相应的状态连接边和数字长度;
从所述规则的有限状态图中删除所述状态连接边,并记录所述状态连接边的起点和终点;
从所述多个数字的有限状态图中,确定与所述数字类别和数字长度匹配的目标有限状态图;
新增第一状态边和第二状态边,生成多个数字识别模型;其中,所述第一状态边由所述状态连接边的起点到所述目标有限状态图的起点,所述第一状态边由所述目标有限状态图的终点到所述状态连接边的终点。
7.根据权利要求1所述的方法,其特征在于,还包括:
获取待识别音频数据;
将所述待识别音频数据输入至所述数字识别模型,输出识别数字。
8.一种数据处理装置,其特征在于,包括:
数字枚举模块,用于从零开始枚举预设位数的所有数字;
数字模型生成模块,用于根据枚举的所有数字生成数字模型;
状态图转化模块,用于将所述数字模型转化为数字有限状态图;
规则获取模块,用于获取语法规则,并将所述语法规则转化为规则有限状态图;
识别模型生成模块,用于合并所述数字有限状态图和规则有限状态图,生成数字识别模型,以采用所述数字识别模型识别数字。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行如权利要求1-7所述的一个或多个的方法。
10.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-7所述的一个或多个的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010456999.6/1.html,转载请声明来源钻瓜专利网。