[发明专利]音频数据处理方法、装置、电子设备、存储介质及产品在审
申请号: | 202111539880.6 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114299997A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 李良斌;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L15/02;G10L15/22 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 王静 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种音频数据处理方法、装置、电子设备、存储介质及产品,属于语音交互技术领域。方法包括:接收输入的音频数据,对音频数据进行识别处理,输出识别结果;在识别结果包括唤醒词的情况下,获取音频数据的解码图,解码图包括音频数据对应的解码路径的跳转标识序列,跳转标识序列用于表示音频数据中相邻音频帧之间的音素变化情况;从跳转标识序列中确定目标跳转标识,目标跳转标识满足目标条件,目标条件表示跳转标识序列中的跳转标识属于唤醒词的唤醒音素序列对应的跳转标识;基于目标跳转标识,确定唤醒词对应的唤醒音频数据的首端点。该方案实现了音素级别的端点检测,能够准确地检测出唤醒音频数据的首端点。 | ||
搜索关键词: | 音频 数据处理 方法 装置 电子设备 存储 介质 产品 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111539880.6/,转载请声明来源钻瓜专利网。