[发明专利]一种基于对口语化时间段语音识别率提升方法在审

专利信息
申请号: 202011218652.4 申请日: 2020-11-04
公开(公告)号: CN112420027A 公开(公告)日: 2021-02-26
发明(设计)人: 辛裴;陈鹏;杨祉雄 申请(专利权)人: 北京致远互联软件股份有限公司
主分类号: G10L15/08 分类号: G10L15/08;G10L15/18
代理公司: 北京权智天下知识产权代理事务所(普通合伙) 11638 代理人: 王新爱
地址: 100089 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 口语化 时间段 语音 识别率 提升 方法
【说明书】:

发明公开了一种基于对口语化时间段语音识别率提升方法,其具体操作流程包含以下步骤:A、规范输入目的性语音信息;B、正则提取时间文字;C、将提取出的关键时间文字转数字格式;D、判断是否有连接文字或分割符;E、结合上下文日期嗅探补全;F、规范显示目的性信息,利用了时间格式文字数量有限性的特征,通过正则模板将时间文字提取,而无需通过穷举去增加语料库;实现了两个时间的连接识别,适配了用户输入时间段的需求;通过用户输入的文本上下文嗅探出用户输入的时间段中隐含的日期语句;将用户语误的情况进行了适当处理,避免了客观不存在的时间段格式,提升用户智能效果的体验。

技术领域

本发明涉及互联网应用技术领域,具体为一种基于对口语化时间段语音 识别率提升方法。

背景技术

人工智能语音识别时间类型的文字常常依赖经验值,将有限的时间语言 表达文字进行穷举,作为语料库进行模型训练;然后将语音识别出来的语句, 含有时间词语的文字提取出来,转换成计算机使用的时间格式数据进行业务 处理,如:“明天上午----2020-09-04 09:00”,“下午六点十分 -----2020-09-03 18:10”,语料库越多越丰富,能识别的时间文字越多,但 是时间格式的文字是有限的,即人类对时间的语言表达的方式是有限的。

目前的时间文字语料库并未真正覆盖用户的口语化习惯,如:“预定一个明 天上午十点到十一点的会议”,对于现有的时间格式转换技术,只能将“明天上 午十点”这样的文字进行格式转换,无法将语句中出现的时间段词语进行转 换,且像“礼拜一到礼拜二”这样的语句更是无法转换;想要将用户对于时间 段的词语理解到,用户需要和语音机器人进行多轮对话,才能把用户想要的时 间段文字转换出来,导致用户表达一个时间段的意图十分困难,使用户使用体 验十分不友好,长此以往,有可能用户就会放弃使用。

现有大数据背景下,两个连接时间的语料库不够,不足以解析用户常用 的说话习惯和语法,如:“提醒我明天下午四点到十点完成业务报表”,现有 技术只能把“明天下午四点”提取出来,后面的“十点”无法提取出来。

如果要丰富两个时间连接的文字,需要穷举大量的文本到语料库中,有 可能会忽略掉语误的情况,比如上面说的:“明天早上十一点到十点”;还有 缺少日期补全机制,“十点”这个文字就没有日期,只是一个时间点,并没有 通过上下文嗅探出日期。

所以针对现今已有的技术,如何解决上述提出的问题,成为了当前急需 解决的难题。

发明内容

本发明的目的在于提供一种将用户语误的情况进行了适当处理,避免了 客观不存在的时间段格式,提升用户智能效果的体验的基于对口语化时间段 语音识别率提升方法。

为实现上述目的,本发明提供如下技术方案:一种基于对口语化时间段 语音识别率提升方法其具体操作流程包含以下步骤:

A、规范输入目的性语音信息;

B、正则提取时间文字;

C、将提取出的关键时间文字转数字格式;

D、判断是否有连接文字或分割符;

E、结合上下文日期嗅探补全;

F、规范显示目的性信息。

作为优选,根据步骤A规范输入目的性语音信息:

a、打开语音识别记录装置,规范输入目的性语音信息;

b、语音重播确认语音信息输入有效。

作为优选,根据步骤B正则提取时间文字:

a、根据时间文字语料库有限性的特征,将可能出现的文字格式形成正则 模板;

b、通过正则模板将文本中多余的文字过滤掉,只留下时间文字和连接字。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京致远互联软件股份有限公司,未经北京致远互联软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011218652.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top