[发明专利]一种信息处理方法和装置有效
申请号: | 202110281157.6 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113077802B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 张银平;杨琳;汪俊杰 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L15/16;G10L15/18 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 周伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
1.一种信息处理方法,应用于具有语音采集功能的电子设备,所述电子设备的语音采集的角度范围按第一规则被划分成多个区域,所述方法包括:
以各个区域为单位,对所述电子设备采集到的第一语音信号进行语音增强处理,获得所述各个区域分别对应的第二语音信号;
根据所述各个区域分别对应的第二语音信号进行语音激活处理,获得被激活的至少一个候选区域;
对所述候选区域后续对应的第三语音信号进行语音增强处理,获得对应所述候选区域的第四语音信号;
若确定所述第二语音信号与第四语音信号属于同一个目标对象,则对所述候选区域进行细粒度划分调整;
根据所述细粒度划分调整结果更新所述第一规则,更新后的所述第一规则用作下一次的语音激活处理。
2.根据权利要求1所述信息处理方法,所述根据各个区域分别对应的第二语音信号进行语音激活处理,获得被激活的至少一个候选区域,包括:
根据预设语音激活算法计算各个区域分别对应的第二语音信号的激活分数,将所述激活分数达到预设分数阈值的第二语音信号所对应的区域确定为被激活的候选区域。
3.根据权利要求1所述信息处理方法,在对所述候选区域进行细粒度划分调整之前,所述方法还包括:
记录所述语音采集的角度范围内被划分的各个区域的被激活次数;
对激活次数大于等于第一阈值的区域进行细粒度划分调整。
4.根据权利要求3所述信息处理方法,在进行细粒度划分调整的过程中,所述方法还包括:
判断所述激活次数大于等于第一阈值的各区域粒度是否达到粒度下限;
对于未达到所述粒度下限的区域,按粒度划分规则划分为多个子区域,其中所述子区域的粒度不低于所述粒度下限;
对于达到所述粒度下限的区域,不执行所述细粒度划分调整。
5.根据权利要求3所述信息处理方法,所述方法还包括:
对激活次数小于等于第二阈值的区域进行粗粒度划分调整;
根据所述粗粒度划分调整结果更新所述第一规则。
6.根据权利要求5所述信息处理方法,所述对激活次数小于等于第二阈值的区域进行粗粒度划分调整,包括:
判断所述激活次数小于等于第二阈值的各区域粒度是否达到粒度上限;
对于未达到所述粒度上限的区域,将相邻的区域按粒度合并规则进行合并,其中所述合并后的区域粒度不高于所述粒度上限;
对于达到所述粒度上限的区域,不执行所述粗粒度划分调整。
7.根据权利要求1所述信息处理方法,所述第一规则的初始配置为:按初始粒度,将所述电子设备的语音采集的角度范围平均划分成多个区域。
8.根据权利要求1所述信息处理方法,所述方法还包括:
判断所述候选区域对应的第四语音信号是否为交互类语音,以及所述交互类语音与所述第二语音信号的属性近似度是否达到预设的近似度阈值,在判断结果为是时,执行与所述交互类语音对应的后续交互类操作。
9.根据权利要求8所述信息处理方法,通过以下方式确定所述候选区域对应的第四语音信号是否为交互类语音:
判断所述候选区域对应的第四语音信号是否有后续有效语音,在判断结果为是时,对所述后续有效语音进行自动语音识别ASR处理获得ASR识别结果,对所述ASR识别结果进行自然语言处理NLP分析,判断所述NLP分析结果是否为交互类语句,若所述NLP分析结果为交互类语句,则确定所述候选区域对应的第四语音信号为交互类语音。
10.一种信息处理装置,应用于具有语音采集功能的电子设备,所述电子设备的语音采集的角度范围按第一规则被划分成多个区域,包括:
第一语音增强模块,用于以各个区域为单位,对所述电子设备采集到的第一语音信号进行语音增强处理,获得所述各个区域分别对应的第二语音信号;
激活处理模块,用于根据所述各个区域分别对应的第二语音信号进行语音激活处理,获得被激活的至少一个候选区域;
第二语音增强模块,用于对所述候选区域后续对应的第三语音信号进行语音增强处理,获得对应所述候选区域的第四语音信号;
粒度划分调整模块,用于若确定所述第二语音信号与第四语音信号属于同一个目标对象,则对所述候选区域进行细粒度划分调整;
规则更新模块,用于根据所述细粒度划分调整结果更新所述第一规则,更新后的所述第一规则用作下一次的语音激活处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110281157.6/1.html,转载请声明来源钻瓜专利网。