[发明专利]语音数据处理的方法、装置、设备、存储介质及程序产品在审
申请号: | 202011568883.8 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112509567A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 周毅;左声勇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L21/0208;G10L15/20;G10L15/22 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 钭飒飒;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据处理 方法 装置 设备 存储 介质 程序 产品 | ||
1.一种语音数据处理的方法,包括:
获取采集的语音数据和播报信息;
将所述语音数据与所述播报信息进行相似度匹配,确定所述语音数据中所包含的播报信息;
去除所述语音数据中所包含的播报信息,得到所述语音数据所包含的用户指令信息。
2.根据权利要求1所述的方法,其中,所述将所述语音数据与所述播报信息进行相似度匹配,确定所述语音数据中所包含的播报信息,包括:
将所述语音数据与所述播报信息对应的播报语音进行波形相似度匹配,确定所述语音数据中所包含的播报语音;
和/或,
对所述语音数据进行语音识别,得到所述语音数据对应的识别文本;将所述识别文本与所述播报信息对应的播报文本进行文本相似度匹配,确定所述识别文本中所包含的播报文本。
3.根据权利要求2所述的方法,其中,所述将所述识别文本与所述播报信息对应的播报文本进行文本相似度匹配,确定所述识别文本中所包含的播报文本,包括:
对所述识别文本和所述播报文本分别进行分词处理,得到所述识别文本所包含的词、以及所述播报文本所包含的词;
将所述识别文本所包含的词与所述播报文本所包含的词进行匹配,确定所述识别文本是否包含至少一个目标词,所述至少一个目标词为所述播报文本所包含的词、且所述至少一个目标词位于所述识别文本的始端;
若确定所述识别文本包含至少一个目标词,则确定所述至少一个目标词为所述识别文本中所包含的播报文本。
4.根据权利要求2所述的方法,其中,所述将所述识别文本与所述播报信息对应的播报文本进行文本相似度匹配,确定所述识别文本中所包含的播报文本,包括:
将所述识别文本所包含的字与所述播报文本所包含的字进行匹配,确定所述识别文本是否包含至少一个目标字以及置信度,所述至少一个目标字为所述播报文本所包含的字、且所述至少一个目标字位于所述识别文本的始端;
若确定所述识别文本包含至少一个目标字,且所述置信度大于或等于第一阈值,则确定所述至少一个目标字为所述识别文本中所包含的播报文本。
5.根据权利要求4所述的方法,其中,所述将所述识别文本所包含的字与所述播报文本所包含的字进行匹配,确定所述识别文本是否包含至少一个目标字以及置信度之后,还包括:
若所述置信度小于所述第二阈值,则确定所述识别文本中不包含播报文本。
6.根据权利要求4所述的方法,其中,所述将所述识别文本所包含的字与所述播报文本所包含的字进行匹配,确定所述识别文本是否包含至少一个目标字以及置信度之后,还包括:
若所述置信度小于所述第一阈值,且大于或等于第二阈值,则将所述语音数据与所述播报语音进行波形相似度匹配,确定所述语音数据中所包含的播报语音。
7.根据权利要求3或4所述的方法,其中,所述去除所述语音数据中所包含的播报信息,得到所述语音数据所包含的用户指令信息,包括:
将所述识别文本中所包含的播报文本去除,得到所述语音数据所包含的用户指令信息。
8.根据权利要求2或6所述的方法,其中,所述将所述语音数据与所述播报信息对应的播报语音进行波形相似度匹配,确定所述语音数据中所包含的播报语音,包括:
根据所述播报信息对应的播报语音的时长,从所述语音数据的始端截取与所述播报语音具有相同时长的语音片段;
将所述语音片段与所述播报语音的波形进行匹配,确定所述语音片段与所述播报语音的相似度、相似片段、以及所述相似片段在所述语音片段中的起始位置和终止位置。
9.根据权利要求8所述的方法,其中,所述将所述语音片段与所述播报语音的波形进行匹配,确定所述语音片段与所述播报语音的相似度、相似片段、以及所述相似片段在所述语音片段中的起始位置和终止位置之后,还包括:
若所述语音片段与所述播报语音的相似度大于第三阈值,则确定所述相似片段为所述语音数据中所包含的播报语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011568883.8/1.html,转载请声明来源钻瓜专利网。