[发明专利]口音识别模型建立方法、装置及存储介质和电子设备有效
申请号: | 202110888963.X | 申请日: | 2021-08-03 |
公开(公告)号: | CN113592559B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 徐延广;颜瑞;解传栋 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/16;G06N3/04;G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 衣淑凤;宋志强 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口音 识别 模型 建立 方法 装置 存储 介质 电子设备 | ||
1.一种口音识别模型建立方法,其特征在于,该方法包括:
获取第一城市集合中每个第一城市的用户语音训练样本集;
分别采用第一城市集合中的每个第一城市的用户语音训练样本集对对应的第一城市的单城口音识别模型进行训练,得到每个第一城市的单城口音识别模型;
分别将第二城市集合中的每个第二城市的用户语音测试样本集输入到第一城市集合中的每个第一城市的单城口音识别模型,并计算每个第一城市的模型对每个第二城市的识别率;对于每个第二城市,在所有第一城市的单城口音识别模型中选择:识别率最高且识别率大于第一阈值的模型,并将所选择的模型对应的第一城市和该第二城市划分到同一口音区域;其中,第二城市集合包含第一城市集合;
针对每一口音区域,采用该口音区域内的所有城市的用户语音训练样本集对该口音区域的区域口音识别模型进行训练,得到该口音区域的区域口音识别模型。
2.根据权利要求1所述的方法,其特征在于,所述得到该口音区域的区域口音识别模型之后,进一步包括:
接收到第一用户的语音,确定第一用户所在城市对应的口音区域,将第一用户的语音输入到该口音区域的区域口音识别模型,得到第一用户的语音对应的文本。
3.根据权利要求1所述的方法,其特征在于,所述将所选择的模型对应的第一城市和该第二城市划分到同一口音区域之后、所述针对每一口音区域,采用该口音区域内的所有城市的用户语音训练样本集对该口音区域的区域口音识别模型进行训练之前,进一步包括:
从所有口音区域中每次选取至少两个口音区域进行组合,直至得到所有组合,将每个组合分别作为一个口音区域集,对于每个口音区域集,采用该口音区域集内的所有城市的用户语音训练样本集对该口音区域集的区域集口音识别模型进行训练,得到该口音区域集的区域集口音识别模型,采用该口音区域集内的多个城市的用户语音测试样本集对该口音区域集的区域集口音识别模型和该多个城市各自对应的单城口音识别模型进行测试,若测试结果表明:区域集口音识别模型的识别率与每个城市的单城口音识别模型的识别率的差值都在预设范围内,则确定将该口音区域集内的所有口音区域融合为一个新的口音区域。
4.根据权利要求1或3所述的方法,其特征在于,所述单城口音识别模型、区域口音识别模型和区域集口音识别模型采用的损失函数为:交叉熵损失函数和区分性损失函数的加权求和;
所述单城口音识别模型、区域口音识别模型和区域集口音识别模型的结构为:时延神经网络TDNN与长短期记忆网络LSTM的组合。
5.根据权利要求4所述的方法,其特征在于,所述得到该口音区域的区域口音识别模型之后,进一步包括:
对于每个口音区域,采用该口音区域内的所有城市的用户语音训练样本集,在该口音区域的区域口音识别模型的基础上,对该口音区域的区域口音区分模型进行训练,得到该口音区域的区域口音区分模型;其中,区域口音区分模型的结构与区域口音识别模型的结构相同,区域口音区分模型采用的损失函数为:区分性损失函数;
接收到第一用户的语音,确定第一用户所在城市对应的口音区域,将第一用户的语音输入到该口音区域的区域口音区分模型,得到第一用户的语音对应的文本。
6.根据权利要求4所述的方法,其特征在于,所述得到该口音区域的区域口音识别模型之后,进一步包括:
对于每个口音区域,将该口音区域内的所有城市的用户语音训练样本集划分为多个训练样本子集,依次采用每个训练样本子集对该口音区域的区域口音区分模型训练,得到该口音区域的区域口音区分模型,其中,
第一个训练样本子集对应的区域口音区分模型是在该口音区域的区域口音识别模型的基础上进行训练的;
后续每个训练样本子集对应的区域口音区分模型是在前一训练样本子集对应的区域口音区分模型的基础上进行训练的;
其中,区域口音区分模型的结构与区域口音识别模型的结构相同;
区域口音区分模型采用的损失函数为:区分性损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110888963.X/1.html,转载请声明来源钻瓜专利网。