[发明专利]语音信号处理方法及装置在审

申请号：	201710501168.4	申请日：	2017-06-27
公开（公告）号：	CN107170451A	公开（公告）日：	2017-09-15
发明（设计）人：	王永庆	申请（专利权）人：	乐视致新电子科技（天津）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L25/03;H04N5/44;H04N21/422
代理公司：	暂无信息	代理人：	暂无信息
地址：	300467 天津市滨海新区天津生态***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音信号处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明的实施方式涉及语音技术领域，更具体地，本发明的实施方式涉及语音信号处理方法及装置。

背景技术

电视语音识别分为近讲和远讲，近讲是利用遥控器对电视进行语音操控，远讲则是直接对电视进行语音操控。一次完整的近讲电视语音识别的步骤是：首先按住遥控器语音按键，然后对准遥控器上的麦克风进行说话，说完后，松开遥控器上的语音按键，语音进行识别，最后电视执行对应的命令。

很多电视用户，尤其是初次使用者或小孩，在按住遥控器上的语音按键对电视进行语音操控时，可能会提前松开遥控器上的语音按键，这样会导致语音识别结果不准确。在相关的现有技术中，对于上述问题给出的解决方案是，当用户松开遥控器物理按键时，遥控器录音系统继续工作，延长一段录音时间。这样，用户即便是提前松开了遥控器的语音按键，遥控器上的麦克风实际还在工作，继续接收用户的语音。

但是，本发明的发明人在研究中发现：1.延长遥控器录音工作时间是针对所有用户的，没有分析用户习惯，无针对性，然而并不是所有用户都有提前松开遥控器语音按键的习惯，这样会浪费资源。2.用户并不知道松开遥控器语音按键后还在录音，这样会影响用户体验。3.延长录音时间的长短不好控制，时间过长可能会导致新语音识别错误。

发明内容

为此，本发明的实施方式提供了一种语音信号处理方法及装置，以解决现有技术中由于直接延长遥控器录音时间而导致的资源浪费和语音识别错误的问题。

为了实现上述目的，本发明的实施方式提供如下技术方案：

在本发明的实施方式的第一方面中，提供了一种语音信号处理方法，其特征在于，包括：获取语音信号；基于所述语音信号的能量信息，判断所述语音信号是否完整；若所述语音信号不完整，则生成提醒信号。

在本发明的一个实施例中，基于所述语音信号的能量信息，判断所述语音信号是否完整，包括：基于所述语音信号的能量信息，判断所述语音信号尾部和所述语音信号前端中的至少一个是否被截断；如果所述语音信号尾部和所述语音信号前端中的至少一个被截断，确定所述语音信号不完整。

在本发明的另一实施例中，基于所述语音信号的能量信息，判断所述语音信号尾部是否被截断，包括：根据所述语音信号尾部预设时间段内的能量信息和所述语音信号的能量信息，判断所述语音信号尾部是否被截断；基于所述语音信号的能量信息，判断所述语音信号前端是否被截断，包括：根据所述语音信号前端指定时间段内的能量信息和所述语音信号的能量信息，判断所述语音信号前端是否被截断。

在本发明的又一个实施例中，根据所述语音信号尾部预设时间段内的能量信息和所述语音信号的能量信息，判断所述语音信号尾部是否被截断，包括：判断所述语音信号尾部预设时间段内的平均能量是否大于所述语音信号的平均能量的预设倍数；如果所述语音信号尾部预设时间段内的平均能量大于所述语音信号的平均能量的预设倍数,确定所述语音信号尾部被截断；所述预设倍数大于0且小于1；根据所述语音信号前端指定时间段内的能量信息和所述语音信号的能量信息，判断所述语音信号前端是否被截断，包括：判断所述语音信号前端指定时间段内的平均能量是否大于所述语音信号的平均能量；如果所述语音信号前端指定时间段内的平均能量大于所述语音信号的平均能量的指定倍数，确定所述语音信号前端被截断；所述指定倍数大于0且小于1。

在本发明的再一个实施例中，所述预设时间段为150毫秒到200毫秒之间，所述预设倍数为0.4；所述指定时间段为150毫秒到200毫秒之间，所述指定倍数为0.4。

在本发明的实施方式的第二方面中，提供了一种语音信号处理装置，其特征在于，包括：获取单元，用于获取语音信号；判断单元，用于基于所述语音信号的能量信息，判断所述语音信号是否完整；生成单元，用于若所述语音信号不完整，则生成提醒信号。

在本发明的一个实施例中，所述判断单元具体用于：基于所述语音信号的能量信息，判断所述语音信号尾部和所述语音信号前端中的至少一个是否被截断；如果所述语音信号尾部和所述语音信号前端中的至少一个被截断，确定所述语音信号不完整。

在本发明的另一实施例中，所述判断单元具体用于：根据所述语音信号尾部预设时间段内的能量信息和所述语音信号的能量信息，判断所述语音信号尾部是否被截断；根据所述语音信号前端指定时间段内的能量信息和所述语音信号的能量信息，判断所述语音信号前端是否被截断。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于乐视致新电子科技（天津）有限公司，未经乐视致新电子科技（天津）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710501168.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音信号处理方法及装置在审

专利文献下载