[发明专利]一种基于声音特征的物品材质识别方法及装置有效

专利信息
申请号: 201710575310.X 申请日: 2017-07-14
公开(公告)号: CN107545902B 公开(公告)日: 2020-06-02
发明(设计)人: 刘华平;付海滨;孙富春 申请(专利权)人: 清华大学
主分类号: G10L25/03 分类号: G10L25/03;G10L25/18;G10L25/24;G10L25/45;G10L25/51;G01N9/00;G01N24/00;G01N29/44;G06F16/68
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 廖元秋
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 声音 特征 物品 材质 识别 方法 装置
【说明书】:

发明提出一种基于声音特征的物品材质识别方法及装置,属于信号处理和模式识别领域。本方法首先选定不同材质的训练物品,敲击每个训练物品表面获取音频文件,提取音频文件的特征得到训练物品的材质特征系数矩阵,构建材质识别专家数据库并作为训练样本集训练得到极限学习机分类器;获取待测物品的音频文件并提取相应的材质特征系数矩阵,将矩阵输入极限学习机分类器,分类器输出该测试物品的输出预测值矩阵,该矩阵中每个输出值对应一种物品材质类别,最大值所对应的物品材质类别即为该待测物品的材质识别结果。本装置包括麦克风声音采集笔和计算机,两者之间通过蓝牙连接。本发明有效帮助客户进行网购产品材质识别,识别结果准确,实用性强。

技术领域

本发明涉及了一种基于声音特征的物品材质识别方法及装置,属于信号处理和模式识别的领域。

背景技术

目前,作为“互联网+”的应用先锋,网上购物也是电子商务的核心子行业。在这个互联网提供基础设施的世界里,原先面对面的交易被电脑和网线取代了,交易双方只需在电脑前轻轻点击鼠标即可达成交易,交易的过程变得更加快捷容易,浏览、下单、支付和配送更加流畅高效。但同时交易双方之间也产生了新的问题:信任。提供商品的卖家是否有信誉,其销售的商品品质如何,商品是否符合商家的语言和图片描述,成为了网购相比于传统交易需要克服的一个很大的问题。

对于网购客户而言,产品的材质无疑是消费者最关心的问题。虽然商家也对产品的材质通常都有文字进行描述,甚至会拍摄图片,但对于普通消费者而言,由于无法直接看到或者感知到所描述的材质,这种对产品感觉的详细而无偏倚的口头描述并不一定有用。因此消费者在这种情况下购买产品的可能性会有所降低。

基于声音特征的物品材质识别是利用不同的材质发出声音的音色、音调、频率、响度等不同的特性,进行物品材质的识别,例如金属、塑料、布料、木材、纸质、玻璃、陶瓷等等,另外金属又可以分为铁、铜、铝、钢等等,木材也可分为杨木、柳木、榆木等诸多种类。通过声音,不仅可以知道物品的材质,还可以了解到物品的内部特征,比如实心或者空心等等。

现有的声音识别技术,大多是语音的识别,语音识别技术的主要的内容包括声音特征提取、模式匹配原则以及模型训练三个方面。语音识别的应用包括语音导航、语音搜索、语音拨号、语音翻译等,其主要涉及的领域包括模式识别、人工智能、信号处理等等。现阶段尚没有将声音特征应用于物品材质识别的相关技术。

ELM极限学习机为一种典型的单隐层前馈神经网络结构,其以学习速度快、泛化能力强等优点,吸引了国内和国际上的诸多专家学者的关注和研究。ELM不仅适用于回归和拟合问题,也适用在分类和模式识别等领域。ELM在各个领域都得到了广泛的应用。与此同时,ELM不少改进的方法和策略也被陆续提出,使得ELM的性能得到了很大的改善。其应用范围也越来越广泛,重要性因此日益提高。

发明内容

本发明目的是为了克服网购过程中单纯的利用文字描述来进行物品材质识别不足的问题,提出一种基于声音特征的物品材质识别方法及装置。本发明利用混合的MFCC声音特征实现物品材质识别的方法及装置。本发明可有效的帮助客户进行网购产品的材质识别,识别结果准确,实用性强。

本发明提出的一种基于声音特征的物品材质识别方法,其特征在于,包括以下步骤:

1)采集音频文件;

选定一个训练物品,利用麦克风声音采集笔敲击该训练物品的表面产生振动声音信号,将振动声音信号转换成数字声音信号并上传到计算机保存成一个音频文件;每个音频文件的采样频率为44100Hz,采集时长为1s,采集精度16bit,文件保存为wav格式,转换为数据点共有44100个数据点;

2)特征提取;具体包括以下步骤:

2-1)对步骤1)得到的训练物品音频文件的声音数据进行预处理;具体步骤如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710575310.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top