[发明专利]一种捕捉关键词的中文语音应用于浏览器的方法在审
申请号: | 201410422240.0 | 申请日: | 2014-08-26 |
公开(公告)号: | CN104166724A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 黄其 | 申请(专利权)人: | 四川亿信信用评估有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/26 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 谢敏 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 捕捉 关键词 中文 语音 应用于 浏览器 方法 | ||
技术领域
本发明涉及互联网通信技术领域,具体涉及一种捕捉关键词的中文语音应用于浏览器的方法。
背景技术
随着语音识别技术的不断发展,采用语音作为人机交互的手段已经越渐成俗,语音作为一种最自然的人机交互手段,收到越来越多的关注。
语音识别技术是实现人机交互的基础,语音识别是利用计算机从人的语音数据中提取信息,进而确定语音含义的过程。
语音识别可以应用在语音网页浏览器上,传统的网页浏览器采用鼠标作为交互手段,通过鼠标点击网页中的超级链接,跳转到相应的网页。使用鼠标作为交互式手段具有简单、快捷、直接的特点,但是却不是对任何人都适用的,比如双手不方便或者不太认识字的人。本发明针对这种双手不方便或者不太认识字的人,通过语音浏览器的设计解决了他们的用电脑的烦恼。
另外中文语音网页浏览器虽然也有发展,但是语音信号质量较低,连续语音识别比较困难。
发明内容
本发明针对以上的问题提供了一种捕捉关键词的中文语音应用于浏览器的方法,该方法应用关键词捕捉模块,将用户输入的语音信号中包含入关键词即可达成,同时这种浏览器还能够有效去除无关的语音和背景噪声,提高语音浏览器系统的捕捉准确率。与连续语音识别相比,从连续语音信号中提取关键词相对来说较容易,能够达到很好的识别效果。
本发明的目的通过以下技术方案来达到:
一种捕捉关键词的中文语音应用于浏览器的方法,采集语音信号,用计算机安装的声卡、麦克风将语音信号处理后传入缓冲区形成连续的语音信号待用,同时通过网络接口设备实现网页浏览器的内容浏览、并完成页面中超级链接的分析得到链接文字进而整理成链接字典以及网页定向功能;
将连续的语音信号从缓冲区传入端点检测模块进行处理并传输给关键词捕捉模块或者将语音信号交给门限检测模块进行消除杂音处理;所述端点检测模块负责将连续的语音信号进行切分成语音段存储再将语音段交给关键词捕捉模块进行处理;所述关键词捕捉模块输入包括关键词词表和切分出来的语音段,关键词捕捉模块的输出是捕捉到的关键词,将关键词词表和语音段进行信息对比即可捕捉到关键词;
关键词捕捉模块捕捉完成后,将捕捉到的关键词进行链接处理,再将链接处理的结果送至网页浏览器进行网页连接,实现关键词捕捉的语音浏览器的应用。
所述关键词捕捉模块包括特征提取子模块、连续语音识别子模块、关键词捕捉子模块。
所述特征提取子模块对语音信号进行特征提取,获得语音的特征矢量。
所述连续语音识别子模块能够识别拼音。
所述关键词捕捉子模块根据拼音和关键词词表进行关键词的捕捉。
本发明与现有技术相比,所具有以下的优点和有益效果:
本发明应用关键词捕捉模块,将用户输入的语音信号中包含入关键词即可达成,同时这种浏览器还能够有效去除无关的语音和背景噪声,提高语音浏览器系统的捕捉准确率。与连续语音识别相比,从连续语音信号中提取关键词相对来说较容易,能够达到很好的识别效果。
具体实施方式
下面结合实施例对本发明作进一步的详细说明,但本发明的实施方式不限于此。
实施例1
一种捕捉关键词的中文语音应用于浏览器的方法,采集语音信号,用计算机安装的声卡、麦克风将语音信号处理后传入缓冲区形成连续的语音信号待用,同时通过网络接口设备实现网页浏览器的内容浏览、并完成页面中超级链接的分析得到链接文字进而整理成链接字典以及网页定向功能;
将连续的语音信号从缓冲区传入端点检测模块进行处理并传输给关键词捕捉模块或者将语音信号交给门限检测模块进行消除杂音处理;所述端点检测模块负责将连续的语音信号进行切分成语音段存储再将语音段交给关键词捕捉模块进行处理;所述关键词捕捉模块输入包括关键词词表和切分出来的语音段,关键词捕捉模块的输出是捕捉到的关键词,将关键词词表和语音段进行信息对比即可捕捉到关键词;
关键词捕捉模块捕捉完成后,将捕捉到的关键词进行链接处理,再将链接处理的结果送至网页浏览器进行网页连接,实现关键词捕捉的语音浏览器的应用。
关键词捕捉模块包括特征提取子模块、连续语音识别子模块、关键词捕捉子模块。
特征提取子模块对语音信号进行特征提取,获得语音的特征矢量。
连续语音识别子模块能够识别拼音。
关键词捕捉子模块根据拼音和关键词词表进行关键词的捕捉。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川亿信信用评估有限公司,未经四川亿信信用评估有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410422240.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:氮化铝陶瓷基板20瓦贴片式负载片
- 下一篇:功率为100W的12dB衰减片