[发明专利]语音识别设备和方法在审
申请号: | 201880082848.X | 申请日: | 2018-12-19 |
公开(公告)号: | CN111492425A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 徐钻源;金叡薰;尹昭正 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/04;G10L15/28;G10L15/22;G10L21/0208;G10L17/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 设备 方法 | ||
提供的是一种语音识别设备和方法。语音识别设备包括麦克风和处理器,处理器被配置为通过麦克风接收话音信号,通过使用基于神经网络的数据识别模型分析话音信号来生成话音特征数据,基于话音特征数据来确定话音信号是从用户发出的话音还是从外部设备输出的话音,并且当话音信号被确定为从用户发出的话音时,将话音信号确定为用户的话音命令,并且执行对应于话音命令的操作。本公开还涉及利用诸如深度学习的机器学习算法的人工智能(AI)系统及其应用。
技术领域
本公开涉及一种语音识别设备和方法。
本公开还涉及利用诸如深度学习的机器学习算法的人工智能(AI)系统及其应用。
背景技术
人工智能(AI)系统是实现人类水平的智能的计算机系统。与现有的基于规则的智能系统不同,AI是其中机器学习、判断和变得智能的系统。AI系统越来越被人们所认识,并正随着它们被使用而提高它们对用户偏好的理解,并且现有的基于规则的智能系统正逐渐被基于深度学习的AI系统所取代。
AI技术包括机器学习(深度学习)和利用机器学习的元素技术。
机器学习是自己对输入数据的特征进行分类/学习的算法技术。元素技术是利用机器学习算法(诸如深度学习)的技术,并且包括诸如语言理解、视觉理解、推理/预测、知识表示和运动控制的技术领域。
应用AI技术的各个领域如下。语言理解是用于识别、应用和处理人类语言/字符的技术,并且包括自然语言处理、机器翻译、对话系统、查询响应、话音识别/合成等。视觉理解是用于将对象识别和处理为人类视觉的技术,并且包括对象识别、对象跟踪、图像搜索、人类识别、场景理解、空间理解、图像增强等。推理/预测是用于判断以及逻辑地推断和预测信息的技术,并且包括基于知识/概率的推理、优化预测、基于偏好的规划、和推荐。知识表示是用于将人类经验信息自动化为知识数据的技术,并且包括知识构建(数据生成/分类)和知识管理(数据利用)。运动控制是用于控制车辆自主行驶和机器人运动的技术,并且包括运动控制(导航、碰撞、行驶)、操作控制(行为控制)等。
最近,在语音识别领域,已经要求研究一种语音识别设备,该设备从用户的话音命令中掌握用户的意图并向用户提供期望的服务。
发明内容
技术问题
提供的是一种语音识别设备和方法。提供的是其上记录有程序的计算机可读记录介质,该程序当被计算机执行时,执行上述方法。本公开的技术目标不限于此,并且可以存在其他技术目标。
问题的解决方案
根据本公开的一方面,语音识别设备包括麦克风和处理器,该处理器被配置为通过麦克风接收话音信号,通过使用基于神经网络的数据识别模型分析话音信号来生成话音特征数据,基于话音特征数据来确定话音信号是从用户发出的话音还是从外部设备输出的话音,以及当话音信号被确定为用户发出的话音时,将话音信号确定为用户的话音命令,并执行对应于该话音命令的操作。
附图说明
图1是示出根据实施例的操作语音识别设备的示例的图。
图2是示出根据实施例的操作语音识别设备的方法的流程图。
图3A是示出根据实施例的检测话音信号的示例的流程图。
图3B是示出根据实施例的检测话音信号的示例的图。
图4A是示出根据实施例的区分用户的话音和外部设备的话音的示例的流程图。
图4B是示出根据实施例的由语音识别设备过滤外部设备的话音的示例的图。
图4C是示出根据实施例的区分用户的发出的话音和用户的记录的话音的再现的示例的图。
图5是示出根据实施例的生成话音特征数据的示例的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880082848.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:衍射波导元件和衍射波导显示器
- 下一篇:个人清洁组合物