[发明专利]一种会议语音识别方法及系统、存储介质及终端在审
申请号: | 201811504259.4 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109741754A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 杨进玉;许佑骏;刘旭峰 | 申请(专利权)人: | 上海思创华信信息技术有限公司 |
主分类号: | G10L17/06 | 分类号: | G10L17/06;G10L15/26;G10L21/0272;G10L25/51 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 200336 上海市长宁区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种会议语音识别方法及系统、存储介质及终端,包括以下步骤:提取会议参与人的声纹特征,构建会议参与人的声纹特征库;获取会议语音数据,当会议语音数据包含至少两个会议发言人的语音数据时,将会议语音数据分离为与至少两个会议发言人一一对应的发言人语音数据;对于每个发言人语音数据,提取发言人语音数据的声纹特征,查找匹配的声纹特征并判定匹配的声纹特征对应的会议参与人为发言人语音数据对应的会议发言人;对于每个发言人语音数据,文本输出文本数据、会议发言人和发言时间信息。本发明的会议语音识别方法及系统、存储介质及终端。本发明的会议语音识别方法及系统、存储介质及终端提升了多人会议语音识别的实用性。 | ||
搜索关键词: | 会议语音 语音数据 存储介质 声纹特征 终端 会议 匹配 发言时间信息 声纹特征库 多人会议 数据包含 数据分离 文本输出 文本数据 语音识别 构建 判定 查找 | ||
【主权项】:
1.一种会议语音识别方法,其特征在于:包括以下步骤:提取会议参与人的声纹特征,构建所述会议参与人的声纹特征库;获取会议语音数据,当所述会议语音数据包含至少两个会议发言人的语音数据时,将所述会议语音数据分离为与所述至少两个会议发言人一一对应的发言人语音数据;对于每个发言人语音数据,提取所述发言人语音数据的声纹特征,在所述声纹特征库中查找匹配的声纹特征并判定所述匹配的声纹特征对应的会议参与人为所述发言人语音数据对应的会议发言人;对于每个发言人语音数据,将所述发言人语音数据转换为文本数据和发言人时间信息,并文本输出所述文本数据、对应的会议发言人和发言时间信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海思创华信信息技术有限公司,未经上海思创华信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811504259.4/,转载请声明来源钻瓜专利网。