[发明专利]一种语音事件识别装置和方法在审
申请号: | 202110451720.X | 申请日: | 2021-04-26 |
公开(公告)号: | CN113516997A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 杜文强;张明;关磊 | 申请(专利权)人: | 常州分音塔科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;G10L15/26;G10L15/22 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 涂凤琴 |
地址: | 213100 江苏省常州市武进区常武*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 事件 识别 装置 方法 | ||
本发明涉及一种语音事件识别装置和方法,该装置包括:监听单元,用于采集监听到的语音流;敏感词提取单元,用于提取语音流中的敏感词;截取单元,用于当从语音流中提取到敏感词时,截取与敏感词相关的语音段发送至监控人员所持的监控终端。本申请提供的技术方案,不仅可以使监控人员通过听取推送过来的语音段判断事态严重等级,及时做出正确反应,遏制恶劣事件发生,提高了监控人员的工作效率;还提高了事件识别的准确率。
技术领域
本发明属于安防和信号处理领域,具体涉及一种语音事件识别装置和方法。
背景技术
现有的安防领域普遍是基于视频监控的方案,该方案具有可控性,精准性,可以实时查看,事后追踪。但视频监控存在一定的缺点。现有的视频监控由于数量比较大,后台人员不可能做到实时监测到每个监控摄像头所监控的内容,都是基于事件发生后,根据监控内容做事件追溯。
现有一种事件检测技术,通过对周边音频的分析,判定音频所发出声音归属什么类型,如枪声、爆炸声、婴儿哭喊声等,根据音频所属类型进行判定。但是此种方法对事件识别的准确率低,例如,可能存在把玻璃杯子掉地碎掉的事件识别为枪声,因此这两种声音都很尖锐。当对事件识别的准确率低时,会导致后台人员不停唤醒来进行查看。
发明内容
有鉴于此,本发明的目的在于克服现有技术的不足,提供一种语音事件识别装置和方法,以解决现有技术中事件识别的准确率低的问题。
根据本申请实施例的第一方面,提供一种语音事件识别装置,所述装置包括:
监听单元,用于采集监听到的语音流;
敏感词提取单元,用于提取所述语音流中的敏感词;
截取单元,用于当从所述语音流中提取到所述敏感词时,截取与所述敏感词相关的语音段发送至监控人员所持的监控终端。
优选的,所述监听单元,包括:多个声音探头;
每个所述声音探头,用于监听其周围环境中的语音流。
优选的,所述敏感词提取单元,包括:
第一提取模块,用于提取所述语音流中的预设维度的Fbank特征;
第二提取模块,用于提取所述预设维度的Fbank特征中的敏感词。
进一步的,所述第二提取模块具体用于:
利用WFST算法识别所述预设维度的Fbank特征中是否只含有预设的敏感词,若所述预设维度的Fbank特征中只含有预设的敏感词,则提取所述预设维度的Fbank特征中包含的敏感词;否则,无输出结果。
优选的,所述截取单元,具体用于:
当从所述语音流中提取到所述敏感词时,截取所述敏感词所在时刻之前和/或之后预设时长内的语音段发送至监控人员所持的监控终端,同时将报警提示发送至监控人员所持的监控终端。
根据本申请实施例的第二方面,提供一种语音事件识别方法,所述方法包括:
采集监听到的语音流;
提取所述语音流中的敏感词;
当从所述语音流中提取到所述敏感词时,截取与所述敏感词相关的语音段发送至监控人员所持的监控终端。
优选的,所述采集监听到的语音流,包括:
利用声音探头监听其周围环境中的语音流。
优选的,所述提取所述语音流中的敏感词,包括:
提取所述语音流中的预设维度的Fbank特征;
提取所述预设维度的Fbank特征中的敏感词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州分音塔科技有限公司,未经常州分音塔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110451720.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种OTS选通器件仿真模型
- 下一篇:多区域人数统计方法及装置