[发明专利]一种基于声纹识别的智能推荐方法及装置在审
申请号: | 201710807173.8 | 申请日: | 2017-09-08 |
公开(公告)号: | CN107656983A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 石忠民;徐叶强;钟力;陈应杨 | 申请(专利权)人: | 广州索答信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02;G10L17/00;G10L17/02;G10L17/04;G10L25/24 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙)44288 | 代理人: | 李天星,彭成 |
地址: | 510663 广东省广州市广州高新技术产业*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声纹 识别 智能 推荐 方法 装置 | ||
技术领域
本发明涉及一种数据处理领域,尤其涉及一种基于声纹识别的智能推荐方法及装置。
背景技术
目前,个性化智能推荐系统在国内外电商、互联网广告、移动互联网等领域的应用已经相当广泛,但基于声纹识别的智能推荐系统在智能家居领域的应用几乎还是空白。
基于语音交互的智能家居,使用者无法像传统的手机或PC用户一样通过账号密码登录。因此,系统无法区分出同一台设备的不同使用者。通过语音控制的智能家居产品,人与机器的语音交互比与手机或PC等通过外设输入的时间成本要高得多。因此,这要求机器与人的语音交互的过程中,对于用户发出的一些模糊指令,如“打开菜谱”、“播放音乐”等,需要尽可能返回最符合用户需求的内容。
但是,现有的方案存在以下缺陷:
(1)推荐的内容与用户的想要的内容关联性不是很大;
(2)同一个账户只能匹配识别一种声音。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种基于声纹识别的智能推荐方法。
本发明的目的之二在于提供一种电子设备。
本发明的目的之三在于提供一种计算机可读存储介质。
本发明的目的之四在于提供一种基于声纹识别的智能推荐装置。
本发明的目的之一采用如下技术方案实现:
一种基于声纹识别的智能推荐方法,包括以下步骤:
声音采集步骤:获取采集到的声音信息并根据声音信息以得声纹特征;
声纹比对步骤:将所述声纹特征与存储的样本声纹特征集进行匹配,所述样本声纹特征集是所述终端的所有合法用户的声纹特征;
属性抽取步骤:对获取到的声音信息进行属性抽取以得属性特征词;
推荐生成步骤:根据属性特征词以及用户知识库以得用户推荐列表,所述用户知识库包括用户交互数据和知识型信息。
进一步地,在声音采集步骤中对采集到的声音信息进行预处理,所述预处理步骤具体包括以下子步骤:
取样步骤:将采集到的声音信息进行等间隔取样以得取样信息;
离散步骤:将取样信息波形的幅度值离散化以得离散化信息;
预加重步骤:对离散化信息进行预加重处理;
分帧步骤:将预加重后离散化信息进行分帧处理以得分帧信息;
加窗步骤:对分帧信息进行加窗处理。
进一步地,在所述声音采集步骤中,对预处理后的声音信息在Mel频率域上提取倒谱系数以得第i帧信号的MFCC系数,该MFCC系数即为声音信号的声纹特征。
进一步地,在所述声纹比对步骤中:所述样本声纹特征集构建具体包括以下步骤:
获取到所有合法用户的样本声音;
通过GMM-UBM方法建立样本声纹特征集
进一步地,所述推荐生成步骤具体包括以下子步骤:根据属性特征词获取相应的查询项目;
获取与查询项目相关用户知识内容,所述用户知识内容包括所有合法用户的交互信息、知识型信息以及当前时间信息;
通过协同过滤推荐算法生成相应的用户推荐列表。
本发明的目的之二采用如下技术方案实现:
一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
声音采集步骤:获取采集到的声音信息并根据声音信息以得声纹特征;
声纹比对步骤:将所述声纹特征与存储的样本声纹特征集进行匹配,所述样本声纹特征集是所述终端的所有合法用户的声纹特征;
属性抽取步骤:对获取到的声音信息进行属性抽取以得属性特征词;
推荐生成步骤:根据属性特征词以及用户知识库以得用户推荐列表,所述用户知识库包括用户交互数据和知识型信息。
进一步地,在声音采集步骤中对采集到的声音信息进行预处理,所述预处理步骤具体包括以下子步骤:
取样步骤:将采集到的声音信息进行等间隔取样以得取样信息;
离散步骤:将取样信息波形的幅度值离散化以得离散化信息;
预加重步骤:对离散化信息进行预加重处理;
分帧步骤:将预加重后离散化信息进行分帧处理以得分帧信息;
加窗步骤:对分帧信息进行加窗处理。
进一步地,在所述声音采集步骤中,对预处理后的声音信息在Mel频率域上提取倒谱系数以得第i帧信号的MFCC系数,该MFCC系数即为声音信号的声纹特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州索答信息科技有限公司,未经广州索答信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710807173.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种系谱追溯可视化方法及装置
- 下一篇:一种处理垃圾渗滤液的生物滤池