[发明专利]一种双声道语音的抢插话分析方法有效
申请号: | 201610209686.4 | 申请日: | 2016-04-06 |
公开(公告)号: | CN105895116B | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 刘郁松;何国涛;李全忠;蒲瑶 | 申请(专利权)人: | 普强信息技术(北京)有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/48 |
代理公司: | 11583 北京华旭智信知识产权代理事务所(普通合伙) | 代理人: | 冯云 |
地址: | 100085 北京市海淀区东北旺西路8号*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种双声道语音的抢插话分析方法,通过语音活动检测技术针对两个声道的录音流进行有效语音端点检测,找出来整个语音中从几秒到几秒说过话;根据两个声道录音的有效语音端点,将每个片段的端点时间统一处理,通过时间点、声道、端点类型三个属性统一描述,并将所有端点平铺到时间轴上;从前往后遍历所有时间点,对端点类型是否为开始位置端点和结束位置端点进行分析。该双声道语音的抢插话分析方法能够在两个或者多个角色之间发生抢话、插话时需要能够及时的捕捉到这一现象,并进行后续处理,避免了抢话和插话不礼貌的通话方式,为客服服务提供了优质的保障。 | ||
搜索关键词: | 一种 双声道 语音 插话 分析 方法 | ||
【主权项】:
1.一种双声道语音的抢插话分析方法,其特征在于,该双声道语音的抢插话分析方法包括以下步骤:/n步骤一、通过语音活动检测技术针对两个声道的录音流进行有效语音端点检测,找出来整个语音中从几秒到几秒说过话;/n步骤二、根据两个声道录音的有效语音端点,将每个片段的端点时间统一处理,通过时间点、声道、端点类型三个属性统一描述,并将所有端点平铺到时间轴上;/n步骤三、从前往后遍历所有时间点,对端点类型是否为开始位置端点和结束位置端点进行分析;/n在步骤一中的有效语音端点包含开始时间、结束时间、说话人三个属性;/n步骤二中端点类型包括开始和结束;/n其中,对端点类型的分析方法包括以下步骤:/n步骤1、检查端点类型;/n步骤2、如果为开始位置端点,则判断栈顶是否包含开始位置;/n步骤3、若栈顶包含开始位置,则判断开始时间位置是否和该开始位置的角色相同;/n步骤4、若相同,则说明数据出错,不可能一个人没有说完话,又重新开始说话;/n步骤5、若不同,则说明发生插话,记录该插话信息,并将栈顶端点弹出;/n步骤6、若栈顶不包含开始位置,则将开始位置压栈,将端点位置加1,并继续循环;/n步骤7、如果为结束位置端点,则判断栈顶是否包含开始位置;/n步骤8、若栈顶包含开始位置,则判断开始时间位置是否和该结束位置的角色是否相同;/n步骤9、若相同,则说明是正常端点,没有发生插话,记录该结束位置时间点;/n步骤10、若不同,则说明数据错误,前面发生了插话确并没有记录;/n步骤11、若栈顶不包含开始位置,则看前一个端点的结束位置和开始位置是否在200ms以内,是则发生抢话,记录抢话发生时间,并将栈顶端点弹出;/n步骤12、将所有抢插话信息整理并记录,其中每段抢插话包含开始时间、结束时间、类型,抢插话方向。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普强信息技术(北京)有限公司,未经普强信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610209686.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于单片机的带防水罩智能插座
- 下一篇:线束连接器结构