[发明专利]语音识别中噪音的过滤方法、装置、介质及对话机器人有效
申请号: | 202010185581.6 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111554293B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 孙非凡;姚沁玥;孙信中;吴涵渠 | 申请(专利权)人: | 深圳市奥拓电子股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L21/0208;G06F16/335 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市罗湖区清水河街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 噪音 过滤 方法 装置 介质 对话 机器人 | ||
1.一种语音识别中噪音的过滤方法,用于指定场景下的噪音文本的过滤,其特征在于,包括:
获取语音语料,并将语音语料转化为文本信息,得到输入文本;
将输入文本输入到相关性模型,相关性模型基于专业语料库判断输入文本与指定场景的相关性;
利用分词工具对输入文本进行分词;
计算每个分词的tf-idf值,根据所有分词的tf-idf值得到一个相关值;其中,计算一个分词的tf-idf值的公式为:
tft,d=log10(count(t,d)+1)
wt,d=tft,d×idft
其中,tft,d表示分词在专业语料库中的重要程度,count(t,d)表示分词在专业语料库中出现的次数,idft表示分词在专业语料库中的逆文档频数,N表示专业语料库中的逆文档总数,dft表示出现分词的逆文档数,wt,d表示分词在专业语料库中的tf-idf值;
将相关值与预设阈值进行比对,若高于预设阈值,则认为是相关,否则认为不相关;
根据相关度确定输入文本是否为噪音文本,将噪音文本过滤,若不是噪音文本,则将输入文本输入到对话系统。
2.根据权利要求1所述的语音识别中噪音的过滤方法,其特征在于,计算一个分词的tf-idf值时,包括:
遍历专业语料库,得到分词在专业语料库中出现的次数;
根据分词在专业语料库中出现的次数,计算得到分词在专业语料库的重要程度;
将专业语料库根据对话意图分成多个逆文档,获取分词在逆文档中出现的逆文档数;
根据分词在逆文档中出现的逆文档数计算分词的逆文档频数;
根据分词在专业语料库中的重要程度及分词的逆文档频数计算得到tf-idf值。
3.根据权利要求1所述的语音识别中噪音的过滤方法,其特征在于,得到输入文本之后,还包括步骤:
将输入文本输入到通顺度模型上,进行通顺度判定;其中,通顺度的判定基于公共语料库和专业语料库进行;
所述根据相关度确定输入文本是否为噪音文本的步骤,具体为:
结合相关度和通顺度确定输入文本是否为噪音文本。
4.根据权利要求3所述的语音识别中噪音的过滤方法,其特征在于,通顺度模型对输入文本的通顺度判定,包括:
将一条输入文本逐字分解;
根据每个字前面的N个字,计算每个字在该输入文本中所在位置的条件概率;
根据每个字的条件概率计算得到该输入文本的整句分值;
根据整句分值进行通顺度判定。
5.根据权利要求4所述的语音识别中噪音的过滤方法,其特征在于,在计算每个字的条件概率时,依据该字与位于该字前的N个字组成的第一连贯词在公共语料库及专业语料库中出现的次数,以及该字与位于该字前的N-1个字组成的第二连贯词在公共语料库及专业语料库中出现的次数计算得到,其中N大于等于1。
6.根据权利要求5所述的语音识别中噪音的过滤方法,其特征在于,N等于2,句子w1w2…wn-2wn-1wn中,字wn所在位置的条件概率的计算公式为:
其中C(X)为X在公共语料库及专业语料库中出现的次数。
7.根据权利要求4所述的语音识别中噪音的过滤方法,其特征在于,在计算每个字的条件概率时,依据该字与位于该字前的N个字组成的第一连贯词在公共语料库及专业语料库中出现的次数,该字与位于该字前的N-1个字组成的第二连贯词在公共语料库及专业语料库中出现的次数,以及该字与位于该字前的N-2个字组成的第三连贯词,结合线性插值计算得到,其中N大于等于2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市奥拓电子股份有限公司,未经深圳市奥拓电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010185581.6/1.html,转载请声明来源钻瓜专利网。