[发明专利]一种基于对口语化时间段语音识别率提升方法在审
申请号: | 202011218652.4 | 申请日: | 2020-11-04 |
公开(公告)号: | CN112420027A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 辛裴;陈鹏;杨祉雄 | 申请(专利权)人: | 北京致远互联软件股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/18 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 口语化 时间段 语音 识别率 提升 方法 | ||
1.一种基于对口语化时间段语音识别率提升方法,其具体操作流程包含以下步骤:
A、规范输入目的性语音信息;
B、正则提取时间文字;
C、将提取出的关键时间文字转数字格式;
D、判断是否有连接文字或分割符;
E、结合上下文日期嗅探补全;
F、规范显示目的性信息。
2.根据权利要求1所述的一种基于对口语化时间段语音识别率提升方法,其特征在于:所述根据步骤A规范输入目的性语音信息:
a、打开语音识别记录装置,规范输入目的性语音信息;
b、语音重播确认语音信息输入有效。
3.根据权利要求1所述的一种基于对口语化时间段语音识别率提升方法,其特征在于:所述根据步骤B正则提取时间文字:
a、根据时间文字语料库有限性的特征,将可能出现的文字格式形成正则模板;
b、通过正则模板将文本中多余的文字过滤掉,只留下时间文字和连接字。
4.根据权利要求1所述的一种基于对口语化时间段语音识别率提升方法,其特征在于:所述根据步骤C将提取出的关键时间文字转数字格式:
a、将时间提词器过滤剩下的文字,进行拆分;
b、通过文字转时间工具转换成数字时间格式。
5.根据权利要求1所述的一种基于对口语化时间段语音识别率提升方法,其特征在于:所述根据步骤D判断是否有连接文字或分割符:
a、将文本中的关于时间的文字以及时间连接词到进行提取;
b、有则继续下一步骤,无则直接生成信息。
6.根据权利要求1所述的一种基于对口语化时间段语音识别率提升方法,其特征在于:所述根据步骤E结合上下文日期嗅探补全:
a、结合上下文对转换结果进行补全;
b、自行判断补全信息确认生成无误。
7.根据权利要求1所述的一种基于对口语化时间段语音识别率提升方法,其特征在于:所述根据步骤F规范显示目的性信息:
a、将两个时间的顺序进行客观地前后排序;
b、语音重播确认生成信息记录成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京致远互联软件股份有限公司,未经北京致远互联软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011218652.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空心杯永磁转子及永磁电机
- 下一篇:一种经济型双动力板材旋转式夹具