[发明专利]录音留言有效性处理方法及系统有效
申请号: | 201510082541.8 | 申请日: | 2015-02-13 |
公开(公告)号: | CN104679729B | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 陈源凯;蒲明彬 | 申请(专利权)人: | 广州市讯飞樽鸿信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L21/10 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 齐文剑 |
地址: | 510665 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 录音留言 敏感词 文本信息 音质 有效性处理 有效语音 语音音频 输出文本 异常检测 用户服务 词库 预设 优化 过滤 敏感 审核 输出 转换 | ||
1.一种录音留言有效性处理方法,其特征在于:其包括以下步骤:
步骤A:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
步骤B:从录音留言音频中提取出语音音频;
步骤C:从语音音频中提取出有效语音段;
步骤D:将有效语音段转换为文本信息;其采用深度神经网络建立声学模型,再根据声学模型和维特比算法对有效语音段进行识别解码以文本信息;
步骤E:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行步骤F;若否,执行步骤G;
步骤F:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
步骤G:输出文本信息;
在步骤D或步骤E或步骤F或步骤G之后还包括步骤H:根据所输入的关键词从录音留言音频中获取对应的检索结果;步骤H包括以下子步骤:
步骤H1:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
步骤H2:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
2.如权利要求1所述的录音留言有效性处理方法,其特征在于:步骤A包括以下子步骤:
步骤A1:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
步骤A2:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;以及
步骤A3:去除录音留言音频的噪声。
3.如权利要求1所述的录音留言有效性处理方法,其特征在于:步骤C包括以下子步骤:
步骤C1:从语音音频中获取各个因子信息;
步骤C2:判断因子信息是否符合预设的因子信息模板,若是,执行步骤C3;若否,执行步骤C4;
步骤C3:提取出对应的因子信息,以组成有效语音段;以及
步骤C4:忽略对应的因子信息。
4.一种录音留言有效性处理系统,其特征在于:其包括以下模块:
音质优化模块:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
语音音频提取模块:从录音留言音频中提取出语音音频;
有效语音段提取模块:从语音音频中提取出有效语音段;
语音文本转换模块:将有效语音段转换为文本信息;其采用深度神经网络建立声学模型,再根据声学模型和维特比算法对有效语音段进行识别解码以文本信息;
敏感词审核模块:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行第一输出模块;若否,执行第二输出模块;
第一输出模块:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
第二输出模块:输出文本信息;
在语音文本转换模块或敏感词审核模块或第一输出模块或第二输出模块之后还包括关键词检索模块:根据所输入的关键词从录音留言音频中获取对应的检索结果;关键词检索模块包括以下子模块:
索引建立模块:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
检索模块:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
5.如权利要求4所述的录音留言有效性处理系统,其特征在于:音质优化模块包括以下子模块:
截幅处理模块:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
音量优化模块:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;
以及
去噪模块:去除录音留言音频的噪声。
6.如权利要求4所述的录音留言有效性处理系统,其特征在于:有效语音段提取模块包括以下子模块:
因子信息获取模块:从语音音频中获取各个因子信息;
因子信息判定模块:判断因子信息是否符合预设的因子信息模板,若是,执行有效语音段生成模块;若否,执行因子信息忽略模块;有效语音段生成模块:提取出对应的因子信息,以组成有效语音段;以及
因子信息忽略模块:忽略对应的因子信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市讯飞樽鸿信息技术有限公司,未经广州市讯飞樽鸿信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510082541.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种能够统计低错的翻译系统
- 下一篇:页面注释方法及装置