[发明专利]一种安保预警方法及系统有效
申请号: | 202110775181.5 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113241060B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 姚娟娟;钟南山 | 申请(专利权)人: | 明品云(北京)数据科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16;G10L25/63 |
代理公司: | 上海汉之律师事务所 31378 | 代理人: | 冯华 |
地址: | 102400 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 安保 预警 方法 系统 | ||
1.一种安保预警方法,其特征在于,包括:
获取训练集,所述训练集包括:多个语音样本,以及与所述语音样本相对应的情感标签;
将所述训练集输入神经网络进行训练,获取安保预警模型;
所述神经网络包括:用于根据语音样本的第一语音特征进行第一情感判定的第一神经网络、用于根据语音样本中的情感语句和情感副词进行第二情感判定的第二神经网络,以及用于根据第一神经网络和第二神经网络的输出结果进行最终情感判定与预警的情感判定网络;
采集目标场所的语音数据;
将所述语音数据输入所述安保预警模型进行情感判定与预警,完成安保预警;
将所述训练集输入神经网络进行训练,获取安保预警模型的步骤包括:
根据预设的第一损失函数和所述第一神经网络输出的第一情感判定结果,对所述第一神经网络进行训练;
根据预设的第二损失函数和所述第二神经网络输出的第二情感判定结果,对所述第二神经网络进行训练,获取安保预警模型;
所述第一损失函数的数学表达为:
其中,为第一损失函数,为预设的第一权值,为预设的第二权值,为样本数,为真实情感标签,为第一神经网络输出的第一情感识别结果中的情感标签,T为常见的代价函数,K1为第一神经网络的第一误差值,为第一控制参数,为第一惩罚项;
所述第二损失函数的数学表达为:
其中,为第二损失函数,为预设的第三权值,为预设的第四权值,为样本数,为真实情感标签,为第二神经网络输出的第二情感识别结果中的情感标签,T为常见的代价函数,K2为第一神经网络的第二误差值,为第二控制参数,为第二惩罚项;
第一情感判定结果的获取步骤包括:将所述训练集输入所述第一神经网络进行人声分离,获取一个或多个人声语音;
对所述人声语音进行第一语音特征提取,获取第一语音特征,所述第一语音特征包括:声纹特征、语速特征、语调特征和音量特征;
将所述声纹特征与预设的声纹特征库中的特征进行匹配,获取与所述声纹特征相对应的身份信息;
根据所述身份信息,确定目标人物;
根据所述语速特征,判断对应语速是否超出预设的语速阈值范围,获取第一判断结果;
将所述语调特征输入预设的语调特征库进行匹配,获取语调匹配结果;
根据所述音量特征,判断对应音量是否超出预设的音量阈值范围,获取第二判断结果;
根据所述第一判断结果、语调匹配结果和第二判断结果,获取与目标人物相对应的情感标签作为第一情感判定结果。
2.根据权利要求1所述的安保预警方法,其特征在于,还包括:
采集目标场所的视频数据;
对所述视频数据进行人物框选,获取人物框;
对所述人物框进行唇形框选,获取所述视频数据中的唇形框;
将所述唇形框输入第三神经网络进行特征提取,获取第一唇形特征;
获取对应时刻的语音数据,对语音数据进行目标语音特征提取,获取目标语音特征;
将所述目标语音特征输入第四神经网络进行处理,获取对应的第二唇形特征;
将同一时刻的第一唇形特征和第二唇形特征进行对比,获取对比结果;
根据所述对比结果,确定所述语音数据与所述人物框的对应关系;
根据所述对应关系和所述安保预警模型输出的安保预警结果,确定对应的目标预警人物,进而进行安保预警。
3.根据权利要求1所述的安保预警方法,其特征在于,所述第二情感判定结果的获取步骤包括:
将所述训练集输入第二神经网络进行第二情感判定,获取第二情感判定结果;
所述第二神经网络包括:用于获取情感语句的隐马尔科夫语音识别子网络、用于对所述情感语句进行语义识别的长短期记忆子网络和用于获取情感副词的卷积神经子网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于明品云(北京)数据科技有限公司,未经明品云(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110775181.5/1.html,转载请声明来源钻瓜专利网。