[发明专利]会议分角色语音合成方法、装置、计算机设备和存储介质有效

申请号：	201910424720.3	申请日：	2019-05-21
公开（公告）号：	CN110322869B	公开（公告）日：	2023-06-16
发明（设计）人：	岳鹏昱;闫冬	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L25/87
代理公司：	北京市京大律师事务所 11321	代理人：	居梦琪
地址：	518033 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	会议角色语音合成方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种会议分角色语音合成方法，其特征在于，包括：

获取用户输入的参会人员信息及与麦克风的关联关系，每个所述参会人员关联一个所述麦克风；所述参会人员信息，包括：所述参会人员的姓名、工号或在公司的其他唯一标识，用于区分各个所述参会人员；

接收开始录音信号，开启多个所述麦克风，通过多个所述麦克风接收多条语音流，分别将每条所述语音流进行断点检测，截取多条有效语音流，将多条所述有效语音流、所述有效语音流对应的音频开始时间、音频长度、关联的参会人员信息一起进行保存，直至接收到结束录音信号，关闭多个所述麦克风；

按照所述音频开始时间顺序，从时间最早开始，将多条所述有效语音流合成一段音频信息，按照所述音频开始时间顺序，将所述音频开始时间、所述音频长度、所述对应的参会人员信息合并成一段角色信息，将所述音频信息中所述有效语音流与所述角色信息中对应的所述音频开始时间进行映射后，将所述音频信息和所述角色信息一起定义为会议音频进行保存；

所述获取用户输入的参会人员信息及与麦克风的关联关系，每个所述参会人员关联一个所述麦克风，还包括：通过会议系统中预设的管理界面，接收所述用户输入的所述参会人员信息及所有所述参会人员与所述麦克风的关联关系；所述用户通过点击对应麦克风，触发输入界面，通过所述输入界面输入对应参会人员信息，完成所述参会人员与所述麦克风在系统层面的关联关系；多个所述麦克风基于收音设备与所述会议系统连接，以所述收音设备的MAC地址作为唯一标识，将所述麦克风名称与对应的MAC地址进行对应，进而完成所述参会人员与所述麦克风的物理关联关系。

2.根据权利要求1所述的会议分角色语音合成方法，其特征在于，所述接收开始录音信号，开启多个所述麦克风，通过多个所述麦克风接收多条语音流，分别将每条所述语音流进行断点检测，截取多条有效语音流，将多条所述有效语音流、所述有效语音流对应的音频开始时间、音频长度、关联的参会人员信息一起进行保存，直至接收到结束录音信号，关闭多个所述麦克风，包括：

接收开始录音信号，对多个已关联的所述麦克风开启录音功能，分别接收每个所述麦克风传送的语音流；

分别对每条所述语音流进行断点检测，若存在断点时，截取一段有效语音流，将截取的所述有效语音流及对应的音频开始时间、音频长度、关联的参会人员信息一起保存至存储介质中，并继续对当前条所述语音流进行断点检测；

接收结束录音信号，对多个已关联的所述麦克风关闭录音功能；

在接收结束录音信号后，若还不存在断点时，则截取从断点检测开始至音频信号结束的所述语音流为有效语音流，将所述有效语音流及对应的音频开始时间、音频长度、关联的参会人员信息一起保存至存储介质中。

3.根据权利要求2所述的会议分角色语音合成方法，其特征在于，所述分别对每条所述语音流进行断点检测，若存在断点时，截取一段有效语音流，包括：

将所述语音流按照固定时长进行分割，将每个分割单元定义为一帧语音，对每帧语音采集数量相同的N个采样点；

计算每帧语音的能量值，所述能量值的计算公式如下：

其中，E为一帧语音的能量值，f_k为第k个采样点的峰值，N为一帧语音的采样点总个数；

若连续M帧语音的能量值高于预设阈值，则将连续M帧语音中高于预设值的第一帧语音定义为一段音频的前断点，若从M+1帧的能量值开始低于预设阈值，且持续一预设时长，则将M+1帧语音定义为一段音频的后断点，截取所述前断点和所述后断点之间的音频为一段所述有效语音流。

4.根据权利要求1所述的会议分角色语音合成方法，其特征在于，所述将所述音频信息和所述角色信息一起定义为会议音频进行保存，包括：

获取用户输入的音频名称，将所述会议音频的文件名称重命名为所述会议音频后进行保存，若设定时间内未获取到所述音频名称，则将所述会议音频的文件名称重命名为最早的音频开始时间后进行保存。

5.根据权利要求1所述的会议分角色语音合成方法，其特征在于，还包括：

接收用户发送的音频回放请求，展示所述会议音频的文件名称；

当用户触发任一所述文件名称后，将所述文件名称对应的所述音频信息进行播放，将所述文件名称对应的角色信息进行展示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910424720.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种主动变频赫姆霍兹共振器及其调频降噪方法
下一篇：一种汉语语音信号切分方法和装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]会议分角色语音合成方法、装置、计算机设备和存储介质有效

专利文献下载