[发明专利]基于多种特征的音频内容一致性分析方法和分析系统有效
申请号: | 201810332970.X | 申请日: | 2018-04-13 |
公开(公告)号: | CN108520740B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 计哲;高圣翔;黄远;孙晓晨;宁珊;刘志会;韩小青 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;天津市国瑞数码安全系统股份有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/08;G10L15/18;G10L15/26 |
代理公司: | 北京力量专利代理事务所(特殊普通合伙) 11504 | 代理人: | 李之壮 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多种 特征 音频 内容 一致性 分析 方法 系统 | ||
1.一种基于多种特征的音频内容一致性分析方法,其特征在于,包括如下步骤:
步骤一:获取语音样本;
步骤二:对所述语音样本的音频模型进行基于多种特征的分析;
步骤三:对所述音频模型的分析结果进行评分设定;
步骤四:对评分设定后的所述音频模型的一致性进行综合特征模型分析;
步骤五:根据所述综合特征模型分析得出所述语音样本的分析结果;
在步骤二中,所述音频模型的分析包括对所述语音样本设定多种特征,并对多种特征赋予权重;
所述音频模型分析的特征包括内容聚类特征、文字语义理解特征、话题分类特征、宣传面向地特征、话题发生地特征、关键词特征和性别特征;
在步骤三中,进行所述评分设定时,分别从偏内容聚类特征和偏文字语义理解特征两方面设定多个特征的评分配置值。
2.根据权利要求1所述的基于多种特征的音频内容一致性分析方法,其特征在于:
所述内容聚类特征的权重为内容聚类权重;所述文字语义理解特征的权重为文字语义理解权重;所述话题分类特征的权重为话题分类权重;所述宣传面向地特征的权重为宣传面向地权重;所述话题发生地特征的权重为话题发生地权重;所述关键词特征的权重为关键词权重;所述性别特征的权重为性别特征权重。
3.根据权利要求1所述的基于多种特征的音频内容一致性分析方法,其特征在于:
在步骤三中,进行所述评分设定时,单个特征的分值为评分配置值乘以单个特征的权重。
4.根据权利要求3所述的基于多种特征的音频内容一致性分析方法,其特征在于:
所述偏内容聚类特征的总分值和所述偏文字语义理解特征的总分值均为各单个特征的分值总和。
5.根据权利要求4所述的基于多种特征的音频内容一致性分析方法,其特征在于:
所述综合特征模型分析的总分值为所述偏内容聚类特征加权后的总分值和所述偏文字语义理解特征加权后的总分值之和的二分之一。
6.根据权利要求5所述的基于多种特征的音频内容一致性分析方法,其特征在于:
在步骤五中,进行所述综合特征模型分析时设有阈值,在所有所述语音样本中,若所述语音样本的所述综合特征模型的分值大于阈值,则判定所述语音样本为同一类。
7.一种基于多种特征的音频内容一致性分析系统,其特征在于,包括:
数据查询管理系统,所述数据查询管理系统用于提供语音样本;
数据存储系统,所述数据存储系统与所述数据查询管理系统相连;
实时分析系统,所述实时分析系统与所述数据存储系统相连,用于对所述语音样本的音频模型进行基于多种特征的分析,所述音频模型的分析包括对所述语音样本设定多种特征,并对多种特征赋予权重;所述音频模型分析的特征包括内容聚类特征、文字语义理解特征、话题分类特征、宣传面向地特征、话题发生地特征、关键词特征和性别特征;
实时评分系统,所述实时评分系统与所述数据存储系统相连,用于对所述音频模型的分析结果进行评分设定;进行所述评分设定时,分别从偏内容聚类特征和偏文字语义理解特征两方面设定多个特征的评分配置值;
模型自学习系统,所述模型自学习系统与所述数据存储系统相连,用于对阈值和所述音频模型进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;天津市国瑞数码安全系统股份有限公司,未经国家计算机网络与信息安全管理中心;天津市国瑞数码安全系统股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810332970.X/1.html,转载请声明来源钻瓜专利网。