[发明专利]文本输出方法及系统、存储介质、电子装置有效
申请号: | 202110662309.7 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113314124B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 司马华鹏;王满洪;汤毅平 | 申请(专利权)人: | 宿迁硅基智能科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 阚梦诗 |
地址: | 223808 江苏省宿*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 输出 方法 系统 存储 介质 电子 装置 | ||
1.一种文本输出系统,其特征在于,所述系统至少包括依次连接的自动语音识别ASR模型组、文本对齐模型和重打分模型;其中,
所述ASR模型组中包括多个ASR模型,每个所述ASR模型配置为将输入的音频数据分别转换为对应的第一文本;
所述文本对齐模型,配置为将第一参照文本依次与其他的所述第一文本进行对齐,得到多个第二文本,其中,所述第一参照文本为多个所述第一文本中长度最长的文本,所述第二文本中缺少字/词的对齐位置使用预设字符进行填充;在多个所述第二文本的长度均相等的情况下,确定多个所述第二文本为目标文本;在多个所述第二文本的长度不等的情况下,将多个所述第二文本中长度最长的文本确定为第二参照文本,将所述第二参照文本依次与其他的所述第二文本进行对齐,得到多个目标文本,其中,所述目标文本中缺少字/词的对齐位置使用所述预设字符进行填充,多个所述目标文本的长度均相等;
所述重打分模型,配置为对多个所述目标文本的每个对齐位置上的字/词进行打分,获取每个所述对齐位置上得分最高的字/词作为目标字/词,将所述目标字/词按照对应的所述对齐位置确定为输出文本。
2.根据权利要求1所述的文本输出系统,其特征在于,所述ASR模型组中包括多个根据不同的建模方法训练的模型,和/或,同种框架下不同网络结构或不同超参数训练的模型,和/或,同种框架下同种网络结构训练的模型在测试时设置不同的解码参数。
3.一种文本输出方法,其特征在于,包括:
通过ASR模型组将输入的音频数据转换为第一文本,其中,所述ASR模型组包括多个ASR模型;
通过文本对齐模型对多个所述第一文本进行对齐处理,得到多个目标文本,其中,多个所述目标文本的长度均相等;
通过重打分模型对多个所述目标文本的每个对齐位置上的字/词进行打分,获取每个所述对齐位置上得分最高的字/词作为目标字/词,将所述目标字/词按照对应的所述对齐位置确定为输出文本;
其中,所述通过所述文本对齐模型对多个所述第一文本进行对齐处理,得到多个目标文本包括:
将第一参照文本依次与其他的所述第一文本进行对齐,得到多个第二文本,其中,所述第一参照文本为多个所述第一文本中长度最长的文本,所述第二文本中缺少字/词的对齐位置使用预设字符进行填充;
在多个所述第二文本的长度均相等的情况下,确定多个所述第二文本为所述目标文本;在多个所述第二文本的长度不等的情况下,将多个所述第二文本中长度最长的文本确定为第二参照文本,将所述第二参照文本依次与其他的所述第二文本进行对齐,得到多个所述目标文本,其中,所述目标文本中缺少字/词的对齐位置使用所述预设字符进行填充。
4.根据权利要求3所述的方法,其特征在于,所述将所述第一参照文本依次与其他的所述第一文本进行对齐得到多个第二文本包括:
同时计算m-1个所述第一文本中的第i个第一文本相对于所述第一参照文本的编辑距离以及所述第一参照文本相对于所述第i个第一文本的编辑距离,以获取所述第i个第一文本与所述第一参照文本对齐后的两个第二文本,其中,m为所述第一文本的数量,m-1个所述第一文本中不包含所述第一参照文本,i<m-1;
依次获取所述m-1个第一文本与所述第一参照文本对齐后的2*(m-1)个所述第二文本。
5.根据权利要求4所述的方法,其特征在于,所述依次获取所述m-1个第一文本与所述第一参照文本对齐后的2*(m-1)个所述第二文本,包括:
指定所述第i个第一文本与所述第一参照文本对齐后的所述两个第二文本中的任一第二文本为判断文本,其中,所述第i个第一文本与所述第一参照文本对齐后的所述两个第二文本的长度相同;
依次比较所述第i个第一文本对应的判断文本和第i+1个第一文本对应的判断文本的长度,确定所述m-1个第一文本对应的判断文本中,长度最长的判断文本为目标判断文本。
6.根据权利要求5所述的方法,其特征在于,在确定所述m-1个第一文本对应的判断文本中,长度最长的判断文本为目标判断文本以后,所述方法还包括:
在2*(m-1)个所述第二文本的长度不等的情况下,将所述目标判断文本确定为所述第二参照文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宿迁硅基智能科技有限公司,未经宿迁硅基智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110662309.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防护式线损分析装置
- 下一篇:控制电路及应用其的AC/DC电源