[发明专利]一种人机语音图形交互系统及方法在审
申请号: | 201711385318.6 | 申请日: | 2017-12-20 |
公开(公告)号: | CN107910002A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 左国玉;潘婷婷;郑涛;陈珂鑫 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10K11/178 |
代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机 语音 图形 交互 系统 方法 | ||
技术领域
本发明涉及智能控制与人机交互领域,特别涉及一种人机语音图形交互系统及方法。
背景技术
随着人类社会的发展和人类生活质量水平的提高,对智能机器人与用户之间的交互形式要求不断提高,一种更智能化、更和谐化的人机交互系统的需求愈发迫切。目前,大多数人机交互系统的语音识别成功率特别低,无法在嘈杂环境或者用户语音命令表达略模糊时做出准确的信息提取与辨别,处理语音指令的能力非常有限。此外,人机交互系统的回馈机制,呈现形式过于单一,用户的互动体验感不强。因此,现有的人机交互系统有待改善与提高。
发明内容
本发明目的是提供一种人机语音图形交互系统及方法,能够在嘈杂环境或者用户语音命令表达略模糊时做出准确的信息提取与辨别,输出语音指令,并根据语音指令以图形形式反馈与用户,避免呈现形式单一,提高用户的互动体验感。
为实现上述目的,本发明提供了如下方案:
一种人机语音图形交互系统,所述人机语音图形交互系统包括声音采集模块、语音处理模块以及动态表情反馈模块;
所述声音采集模块,用于获取用户输入的音频信号;
所述语音处理模块,与所述声音采集模块连接,用于对获取的所述音频信号进行滤波、降噪、转换处理,输出有效文字信号;
所述动态表情反馈模块,与所述语音处理模块连接,用于接收所述有效文字信号,并根据所述有效文字信号反馈相应的动态图形。
可选的,所述声音采集模块包括:麦克风接口和外部声道接口;所述麦克风接口用于直接获取用户输入的音频信号;所述外部声道接口用于获取外部声源部件输入的音频信号。
可选的,所述语音处理模块包括:无源低通滤波电路、主控芯片、低功率音频运算放大器以及音频转化芯片;所述低功率音频运算放大器与所述无源低通滤波电路、所述主控芯片、所述音频转化芯片均连接;所述主控芯片还与所述音频转化芯片连接;所述无源低通滤波电路还与所述声音采集模块连接;所述主控芯片的型号为AT89S51;所述音频数字转换芯片型号为TLV5580;
其中,所述主控芯片包括相等声波产生单元、词汇存储库以及控制单元;所述相等声波产生单元用于产生与所述音频信号振幅相同,相位差180度的相等声波;所述词汇存储库内存储有效词汇和无效词汇;所述无源低通滤波电路用于对获取的所述音频信号进行滤波处理,得到滤波后的音频信号;所述低功率音频运算放大器用于根据所述相等声波,中和所述滤波后的音频信号的噪声,得到声音信号;所述音频转化芯片用于将所述声音信号转化为文字信号;所述控制单元用于根据所述文字信号和所述词汇存储库,剔除无效文字信号,保留有效文字信号。
可选的,所述语音处理模块还包括通信串口;所述通信串口与所述语音处理模块、所述动态表情反馈模块均连接,用于将所述有效文字信号传送至所述动态表情反馈模块。
可选的,所述动态表情反馈模块具体为显示屏;所述显示屏内置Android Studio程序、表情素材存储库以及分类器;通过所述Android Studio程序中的python中的serial库的调用进行串口通信获取所述有效文字信号,并根据所述有效文字信号和所述表情素材存储库,调取所述分类器进行表情素材的选择,再使用所述Android Studio程序中的pillow库提取所述有效文字信号对应的表情素材,逐帧呈现为动态图形。
可选的,所述人机语音图形交互系统还包括外壳、辅助金属元件;所述外壳的材料为阻尼材料;所述辅助金属元件的外部涂层材料为阻尼涂料。
可选的,所述人机语音图形交互系统还包括通讯指示灯;所述通讯指示灯与所述动态表情反馈模块连接,用于显示所述动态表情反馈模块的工作状态。
本发明还提供了一种人机语音图形交互方法,所述人机语音图形交互方法应用于所述的人机语音图形交互系统,所述人机语音图形交互方法包括:
获取用户输入的音频信号;
根据用户输入的所述音频信号,确定有效文字;
将所述有效文字与预先存储的关键词进行匹配,确定所述有效文字的预置值;所述关键词与所述预置值一一对应;
根据所述预置值和预先存储的表情素材,确定所述音频信号对应的动态图形;所述预置值还与所述预先存储的表情素材一一对应。
可选的,所述根据用户输入的所述音频信号,确定有效文字,具体包括:
对用户输入的所述音频信号进行滤波、降噪,得到声音信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711385318.6/2.html,转载请声明来源钻瓜专利网。