[发明专利]一种说话人聚类方法及相关装置有效
申请号: | 201910104208.0 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109800299B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 张鹏;胡新辉;徐欣康 | 申请(专利权)人: | 浙江核新同花顺网络信息股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 说话 人聚类 方法 相关 装置 | ||
1.一种说话人聚类方法,其特征在于,包括:
对第一待测语音段和第二待测语音段进行语音特征距离计算,得到语音特征距离;
对所述第一待测语音段和所述第二待测语音段进行内容特征距离计算,得到内容特征距离;
根据所述内容特征距离在所述语音特征距离中提取说话人特征距离;其中,所述语音特征距离包括所述内容特征距离和所述说话人特征距离,所述语音特征距离中减去所述内容特征距离得到所述说话人特征距离;
判断所述说话人特征距离是否小于距离阈值;
若是,则将所述第一待测语音段与所述第二待测语音段聚类为同一说话人。
2.根据权利要求1所述的说话人聚类方法,其特征在于,对所述第一待测语音段和所述第二待测语音段进行内容特征距离计算,得到内容特征距离,包括:
采用语音识别模型对所述第一待测语音段进行识别,得到第一音素序列;
采用所述语音识别模型对所述第二待测语音段进行识别,得到第二音素序列;
对所述第一音素序列和所述第二音素序列进行相似度计算,得到音素序列相似度;
根据所述音素序列相似度确定所述内容特征距离。
3.根据权利要求2所述的说话人聚类方法,其特征在于,对所述第一音素序列和所述第二音素序列进行相似度计算,得到音素序列相似度,包括:
根据编辑聚类算法对所述第一音素序列和所述第二音素序列进行相似度计算,得到所述音素序列相似度。
4.根据权利要求1所述的说话人聚类方法,其特征在于,对第一待测语音段和第二待测语音段进行语音特征距离计算,得到语音特征距离,包括:
根据贝叶斯信息准则算法对所述第一待测语音段和所述第二待测语音段进行语音特征距离计算,得到所述语音特征距离。
5.根据权利要求1至4任一项所述的说话人聚类方法,其特征在于,还包括:
当对所述第一待测语音段和所述第二待测语音段进行语音特征距离计算之前,对接收到的整段对话语音进行切分,得到多个待测语音段。
6.根据权利要求5所述的说话人聚类方法,其特征在于,还包括:
当所述说话人特征距离大于等于所述距离阈值时,将所述第一待测语音段与所述第二待测语音段聚类为不同说话人。
7.一种说话人聚类系统,其特征在于,包括:
语音特征距离计算模块,用于对第一待测语音段和第二待测语音段进行语音特征距离计算,得到语音特征距离;
内容特征距离计算模块,用于对所述第一待测语音段和所述第二待测语音段进行内容特征距离计算,得到内容特征距离;
说话人特征距离提取模块,用于根据所述内容特征距离在所述语音特征距离中提取说话人特征距离;其中,所述语音特征距离包括所述内容特征距离和所述说话人特征距离,所述语音特征距离中减去所述内容特征距离得到所述说话人特征距离;
距离判断模块,用于判断所述说话人特征距离是否小于距离阈值;
说话人聚类模块,用于当所述说话人特征距离小于所述距离阈值时,将所述第一待测语音段与所述第二待测语音段聚类为同一说话人。
8.根据权利要求7所述的说话人聚类系统,其特征在于,所述内容特征距离计算模块,包括:
第一语音识别单元,用于采用语音识别模型对所述第一待测语音段进行识别,得到第一音素序列;
第二语音识别单元,用于采用所述语音识别模型对所述第二待测语音段进行识别,得到第二音素序列;
相似度计算单元,用于对所述第一音素序列和所述第二音素序列进行相似度计算,得到音素序列相似度;
内容特征距离确定单元,用于根据所述音素序列相似度确定所述内容特征距离。
9.一种说话人聚类装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述的说话人聚类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的说话人聚类方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江核新同花顺网络信息股份有限公司,未经浙江核新同花顺网络信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910104208.0/1.html,转载请声明来源钻瓜专利网。