[发明专利]语音信号的混音方法和装置有效
申请号: | 200910235813.8 | 申请日: | 2009-10-09 |
公开(公告)号: | CN102045461A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 毕永建;邓凌 | 申请(专利权)人: | 杭州华三通信技术有限公司 |
主分类号: | H04M3/56 | 分类号: | H04M3/56;H04N7/15 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 王一斌;王琦 |
地址: | 310053 浙江省杭州市高新技术产业*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种混音方法和一种混音装置,所述方法包括:设置混音时长,所述混音时长小于预设的人耳可承受语音延时对应的混音时长边界值,且大于各参混码流的帧长最大者;对于帧长与混音时长不存在整数倍关系的码流,根据动态拼包原则进行拼包处理,动态拼包原则为:针对同一终端本次参混后产生的码流,令n个拼包所包含的语音时长大于或等于混音时长与n的乘积。使用本发明能够减少混音引入的系统时延,提高视频会议系统的实时性。 | ||
搜索关键词: | 语音 信号 方法 装置 | ||
【主权项】:
一种语音信号的混音方法,其特征在于,确定混音时长,所述混音时长小于预设的人耳可承受语音延时对应的混音时长边界值,且大于各参混码流的帧长最大者;混音过程包括:对各参混终端的码流进行拼包处理;所述拼包步骤包括:对于帧长与混音时长不存在整数倍关系的码流,以帧长的整数倍为拼包单位进行动态拼包处理;具体动态拼包原则为:针对同一终端本次参混后产生的码流,如果能够满足第i个拼包所包含的语音时长与该码流前i‑1个拼包所包含的语音时长之和∑tpb等于混音时长与i的乘积∑thy的条件,则按照∑tpb=∑thy的关系构造第i个拼包;否则,按照∑tpb>∑thy且|∑tpb‑∑thy|小于该码流的一个帧长的关系构造第i个拼包;调用解码器对拼包后的码流进行解码,将解码获得的语音数据放入各参混终端对应的输入缓存通道;每个输入缓存通道的容量大于或等于一个混音时长的数据量,且能够容纳下任意一个拼包;从各输入缓存通道分别读取一个混音时长的语音数据进行混音处理,将混音得到的混音数据分别存入各终端对应的输出缓存通道;每个输出缓存通道的容量大于或等于一个混音时长的数据量,且能够容纳下任意一个拼包;调用编码器对各输出缓存通道中的混音数据进行编码组包处理;所述编码组包步骤包括:对于帧长与设定的混音时长不存在整数倍关系的码流,以帧长的整数倍为组包单位进行动态编码组包处理;具体动态编码组包原则为:针对同一终端本次参混后产生的码流,如果能够满足第i个编码组包所包含的语音时长与该码流前i‑1个编码组包所包含的语音时长之和∑tzb大于混音时长与i的乘积∑thy的条件,则按照∑tzb=∑thy的关系构造第i个编码组包;否则,按照∑tzb<∑thy且|∑tzb‑∑thy|小于该码流的一个帧长的关系构造第i个编码组包。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州华三通信技术有限公司,未经杭州华三通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910235813.8/,转载请声明来源钻瓜专利网。
- 上一篇:行星齿轮减速机的密封结构
- 下一篇:减速器的换挡装置