[发明专利]一种语音数据的处理方法和装置在审
申请号: | 201810914328.2 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109036422A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 武建昌;苏文畅 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/04;G06F17/24 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音数据 原始语音数据 文本数据 目标文本数据 方法和装置 编辑操作 处理内容 处理效率 波形图显示 接收用户 目标语音 语音识别 直观 | ||
本发明实施例提供了一种语音数据的处理方法和装置,所述处理方法包括:获取待处理的原始语音数据;对所述原始语音数据进行语音识别,得到文本数据;接收用户对所述文本数据的编辑操作;依据所述编辑操作对所述文本数据进行编辑,得到目标文本数据;依据所述目标文本数据和所述原始语音数据,确定目标语音数据。通过本发明实施例,解决了以波形图显示语音数据,用户无法感受到语音数据的处理内容,增加了处理难度和降低了语音数据的处理效率的问题,一方面,使得用户可以直观地感受到语音数据的处理内容,另一方面,降低了语音数据的处理难度,提高了语音数据的处理效率。
技术领域
本发明涉及语音信息处理技术领域,特别是涉及一种语音数据的处理方法和一种语音数据的处理装置。
背景技术
随着人工智能技术的进步,语音作为最自然的人机交互方式得到了迅猛发展,使用语音技术的智能产品应用越来越广泛,而语音技术中语音数据处理也越来越重要。
目前对语音数据处理,基本上是将语音数据导入语音处理软件中,先通过语音处理软件将语音数据转换为可视化的波形图,然后在语音处理软件中对波形图进行编辑来对语音数据进行处理。在处理过程中,需要实时播放语音数据以方便用户寻找到需要处理的语音节点,同时用户需要集中精力关注波形图,以获取需要处理的语音节点在波形图中的起始编辑点,然后进行相应的处理操作,一方面,通过波形图用户无法直观感受到语音数据的处理内容,增加了语音数据的处理难度,另一方面,用户需要频繁播放语音数据和集中精力关注波形图确定需要编辑的语音节点,使得语音数据处理变得枯燥繁琐,降低了语音数据的处理效率。
发明内容
本发明实施例公开了一种语音数据的处理方法和一种语音数据的处理装置,以解决现有语音数据的处理中以波形图显示语音数据,用户无法感受到语音数据的处理内容增加了处理难度和降低了语音数据处理效率的问题。
依据本发明的一个方面,提供了一种语音数据的处理方法,包括:
获取待处理的原始语音数据;
对所述原始语音数据进行语音识别,得到文本数据;
接收用户对所述文本数据的编辑操作;
依据所述编辑操作对所述文本数据进行编辑,得到目标文本数据;
依据所述目标文本数据和所述原始语音数据,确定目标语音数据。
可选地,所述文本数据包括文本内容和时间信息,所述时间信息包括对齐的文本时间戳和语音时间戳,所述依据所述编辑操作对所述文本数据进行编辑,得到目标文本数据,包括:
依据所述编辑操作,对所述文本内容、所述文本时间戳和所述语音时间戳进行编辑得到目标文本数据。
可选地,所述依据所述编辑操作,对所述文本内容、所述文本时间戳和所述语音时间戳进行编辑得到目标文本数据,包括:
从所述文本内容中确定所述编辑操作对应的文本片段;
从所述语音时间戳中获取所述文本片段对应的语音片段时间戳;
从所述文本时间戳中获取所述文本片段对应的文本片段时间戳;
依据所述文本片段、语音片段时间戳、文本片段时间戳以及所述编辑操作对所述文本数据进行编辑,得到目标文本数据。
可选地,所述依据所述文本片段、语音片段时间戳、文本片段时间戳以及所述编辑操作对所述文本数据进行编辑,得到目标文本数据,包括:
依据所述文本片段和所述编辑操作对所述文本内容进行编辑,得到编辑后的文本内容;
依据所述语音片段时间戳、所述文本片段时间戳以及所述编辑操作对所述文本时间戳和所述语音时间戳进行调整,得到目标文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810914328.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送方法及家电设备
- 下一篇:一种用于电脑的语音转化文字的输入系统及方法