[发明专利]一种会议语音识别方法及系统、存储介质及终端在审

申请号：	201811504259.4	申请日：	2018-12-10
公开（公告）号：	CN109741754A	公开（公告）日：	2019-05-10
发明（设计）人：	杨进玉;许佑骏;刘旭峰	申请（专利权）人：	上海思创华信信息技术有限公司
主分类号：	G10L17/06	分类号：	G10L17/06;G10L15/26;G10L21/0272;G10L25/51
代理公司：	上海光华专利事务所(普通合伙) 31219	代理人：	徐秋平
地址：	200336 上海市长宁区***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种会议语音识别方法及系统、存储介质及终端，包括以下步骤：提取会议参与人的声纹特征，构建会议参与人的声纹特征库；获取会议语音数据，当会议语音数据包含至少两个会议发言人的语音数据时，将会议语音数据分离为与至少两个会议发言人一一对应的发言人语音数据；对于每个发言人语音数据，提取发言人语音数据的声纹特征，查找匹配的声纹特征并判定匹配的声纹特征对应的会议参与人为发言人语音数据对应的会议发言人；对于每个发言人语音数据，文本输出文本数据、会议发言人和发言时间信息。本发明的会议语音识别方法及系统、存储介质及终端。本发明的会议语音识别方法及系统、存储介质及终端提升了多人会议语音识别的实用性。
搜索关键词：	会议语音语音数据存储介质声纹特征终端会议匹配发言时间信息声纹特征库多人会议数据包含数据分离文本输出文本数据语音识别构建判定查找
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种会议语音识别方法，其特征在于：包括以下步骤：提取会议参与人的声纹特征，构建所述会议参与人的声纹特征库；获取会议语音数据，当所述会议语音数据包含至少两个会议发言人的语音数据时，将所述会议语音数据分离为与所述至少两个会议发言人一一对应的发言人语音数据；对于每个发言人语音数据，提取所述发言人语音数据的声纹特征，在所述声纹特征库中查找匹配的声纹特征并判定所述匹配的声纹特征对应的会议参与人为所述发言人语音数据对应的会议发言人；对于每个发言人语音数据，将所述发言人语音数据转换为文本数据和发言人时间信息，并文本输出所述文本数据、对应的会议发言人和发言时间信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海思创华信信息技术有限公司，未经上海思创华信信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811504259.4/，转载请声明来源钻瓜专利网。

上一篇：一种语音交互方法、装置、终端及服务器
下一篇：语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种会议语音识别方法及系统、存储介质及终端在审

专利文献下载