[发明专利]一种可根据模型的提取频率训练识别模型的方法及系统有效
申请号: | 201610025278.3 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106971734B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02 |
代理公司: | 北京中原华和知识产权代理有限责任公司 11019 | 代理人: | 寿宁 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种可根据模型的提取频率训练识别模型的方法及系统,属于语音识别技术领域;可根据模型的提取频率训练识别模型的方法,采用服务器与客户端远程连接的方式进行数据通信,可将客户端中不常用的通过比较初始识别模型的提取频率,删除不常用的初始识别模型,在服务器中采用语句训练样本对不常用的初始识别模型进行更新,减小了客户端的运行负担,同时提高了工作效率,能够同时兼顾应用于一般智能终端中形成识别模型所需的较好的实用性以及声纹识别所需的准确度。 | ||
搜索关键词: | 一种 根据 模型 提取 频率 训练 识别 方法 系统 | ||
【主权项】:
一种可根据模型的提取频率训练识别模型的方法,其特征在于,提供复数个客户端和一服务器,所述服务器分别与复数个所述客户端远程连接,所述方法包括:所述客户端获取一说话人的初始语音信号流;所述客户端根据预设的说话人分割算法和说话人聚类算法,获取所述初始语音信号流中的语音信号流;所述客户端判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出;所述客户端将所述识别信号流与预先形成的复数个初始识别模型进行匹配,获取匹配成功的所述初始识别模型;所述客户端所述识别信号流作为追加的识别信号流的语句训练样本,并获取所述初始识别模型的提取频率;所述客户端判断所述提取频率是否大于预设提取阈值,将小于或等于所述提取阈值的所述初始识别模型从所述客户端中删除;所述客户端依据所述语句训练样本对大于所述提取阈值的所述初始识别模型进行更新;所述服务器中存储有所有的所述初始识别模型,并依据所述语句训练样本对每个所述客户端中小于或等于所述提取阈值的所述初始识别模型进行更新,最终形成多个识别模型,每个所述识别模型对应于一个所述说话人。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610025278.3/,转载请声明来源钻瓜专利网。