[发明专利]一种识别AI来电的方法、装置、语音助手、终端、计算机设备及计算机可读存储介质有效
申请号: | 201910349993.6 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110198381B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 张伟萌;龚思颖 | 申请(专利权)人: | 北京蓦然认知科技有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/42;H04M3/493;G10L15/02;G10L15/04;G10L15/08;G10L15/26;G10L15/30 |
代理公司: | 北京智丞瀚方知识产权代理有限公司 11810 | 代理人: | 杨乐 |
地址: | 100083 北京市海淀区学院*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 ai 来电 方法 装置 语音 助手 终端 计算机 设备 可读 存储 介质 | ||
1.一种识别AI来电的方法,其特征在于,该方法包括以下步骤:
步骤101、终端接收到来电呼叫时,语音助手自动接通来电;
步骤102、获取来电的语音信号,对语音信号进行预处理;
步骤103、利用数据库对预处理后的语音信号进行分析判断,识别该来电是否属于AI来电;
在步骤103之前,预先建立数据库,其中包括以下步骤:
步骤1、获取多个真人语音样本以及多个AI语音样本,形成语料库;
步骤2、对真人语音样本、AI语音样本按照完整语意、词组两个维度进行切分,形成真人语音段、AI语音段,分别提取两种语音段的长期频谱特征LTAS(The Long Term AverageSpectrum),获取LTAS的基频特征,根据LTAS中的基频特征确定两种语音段的音调;其中完整语意切分粒度大于或等于词组切分粒度;
步骤3、分别识别真人语音段、AI语音段的音素序列,根据各音素的变化位置确定每个音素的发音时间长度,得出两种语音段的发音节奏;
步骤4、建立数据库,将语音段转换为文本,以该文本为索引,存储对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度以及对应的节奏这四个特征参数;其中一个文本可对应于一个或多个真人语音段、一个或多个AI语音段。
2.根据权利要求1所述的方法,其特征在于,
步骤102具体包括:语音助手获取来电的语音信号,滤除语音信号中的噪声值。
3.根据权利要求1所述的方法,其特征在于,由云服务器或者终端预先建立数据库,数据库存储于云服务器或者终端。
4.根据权利要求1所述的方法,其特征在于,利用数据库对预处理后的语音信号进行分析判断,识别该来电是否属于AI来电,具体包括以下步骤:
步骤1031、将预处理后的语音信号按照完整语意进行切分,将切分后的语音段转换为文本,以该文本为索引,查找数据库中是否存在该文本索引,执行步骤1032;
步骤1032、若数据库中存在对应的文本,获取切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏这四个特征参数;将切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏分别与数据库中该文本索引对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏这四个特征参数进行比较,计算切分后的语音段的四个特征参数分别与真人语音、AI语音的四个特征参数的相似度;当数据库中该文本对应于多个真人语音段、和/或多个AI语音段时,将切分后的语音段的四个特征参数分别与数据库中的每个真人语音段、AI语音段的四个特征参数进行相似度计算,并执行步骤1033;若数据库中不存在对应的文本,将预处理后的语音信号按照词组进行切分,获取按照词组切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏这四个特征参数,并执行步骤1034;
步骤1033、当按照语意和/或按照词组切分后的语音段的四个特征参数与真人语音段/AI语音段的四个特征参数比较后的每个特征参数的相似度均高于预设值时,为该语音段的真人属性/AI属性赋值1+a(N-1),否则赋值0;其中N为按照语意和/或按照词组切分后的语音段与多个真人语音段/多个AI语音段的比较中每个特征参数的相似度均高于预设值时真人语音段/AI语音段的个数,a为权重因子,a为正数;执行步骤1035;
步骤1034、将按照词组切分后的语音段转换为文本,以该文本为索引,查找数据库中对应于该文本的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏这四个特征参数;将按照词组切分后的语音段的四个特征参数分别与数据库中该文本索引对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏进行比较,计算切分后的语音段的四个特征参数分别与真人语音、AI语音的四个特征参数的相似度;当数据库中该文本对应于多个真人语音段、和/或AI语音段时,将切分后的语音段的四个特征参数分别与数据库中的每个真人语音、AI语音的四个特征参数进行相似度计算,并执行步骤1033;
步骤1035、对来电的语音信号对应的语音段中真人属性、AI属性分别求和,当真人属性的和值大于AI属性的和值,则判断该来电属于真人来电,否则为AI来电,结束;若真人属性的和值与AI属性的和值相同,则执行步骤1036;
步骤1036、语音助手播放预设语音,与来电进行对话,如向来电提问等;判断来电的回复是否与预设语音内容相关,若相关,则对回复的语音信号进行预处理,执行步骤1031;否则判断其为AI来电,结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京蓦然认知科技有限公司,未经北京蓦然认知科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910349993.6/1.html,转载请声明来源钻瓜专利网。