[发明专利]电子装置及其控制方法在审

申请号：	201980010152.0	申请日：	2019-01-11
公开（公告）号：	CN111656438A	公开（公告）日：	2020-09-11
发明（设计）人：	李营华;郑镇会;朴美正;黄寅喆	申请（专利权）人：	三星电子株式会社
主分类号：	G10L15/16	分类号：	G10L15/16;G10L15/22;G06F3/0484;G06F3/16
代理公司：	北京市柳沈律师事务所 11105	代理人：	刘虹
地址：	韩国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	电子装置及其控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及使用根据机器学习、神经网络或深度学习算法中的至少一种的学习的人工智能(AI)模型的AI系统及其应用。在本公开中，提供了一种电子装置的控制方法。该控制方法包括以下步骤：显示包括至少一个对象的图像；接收语音；将语音输入到按照AI算法学习的AI模型中，以识别包括在图像中的至少一个对象中与语音相关的对象，并获取关于识别的对象的标记信息；以及提供获得的标记信息。

技术领域

本公开涉及一种电子装置及其控制方法，更具体地，涉及一种能够基于用户语音生成标记(tag)信息的电子装置及其控制方法。

背景技术

近年来，人工智能(artificial intelligence，AI)系统已经应用于各种领域。不同于现有的基于规则的智能系统，AI系统是机器学习、判断和反复改进分析和决策的系统。随着AI系统的使用增加，例如，准确度、辨识率以及对用户的喜好的理解或预期会相应地增加。因此，现有的基于规则的智能系统正逐渐被基于深度学习的AI系统所取代。

AI技术由机器学习(例如深度学习)和利用机器学习的基础技术组成。

机器学习是算法技术，其能够分类或学习输入数据的特性。基础技术是使用机器学习算法(诸如深度学习)来模拟功能(诸如人脑的辨识和判断)的技术。机器学习由诸如语言理解、视觉理解、推理、预测、知识表示、运动控制等技术领域组成。

实现AI技术的各种领域可能包括以下内容。语言理解是用于辨识、应用和/或处理人类语言或字符的技术，包括自然语言处理、机器翻译、对话系统、问答、语音辨识或合成等。视觉理解是用于辨识和处理作为人类视觉的对象的技术，包括对象辨识、对象跟踪、图像搜索、人类辨识、场景理解、空间理解、图像增强等。推断预测是用于判断、逻辑推断和预测信息的技术，包括基于知识和基于概率的推断、优化预测、基于偏好的规划、推荐等。知识表示是用于将人类经验信息自动化为知识数据的技术，包括知识构建(数据生成或分类)、知识管理(数据利用)等。运动控制是用于控制车辆的自动行驶和机器人的运动的技术，包括运动控制(导航、碰撞、驾驶)、操作控制(行为控制)等。

为了信息的高效管理和各种用户体验，电子装置已经提供了为图像生成标记信息的功能。标记信息是图像的数据和一种元数据。

至于现有技术标记信息生成方法，一般地，仅用任何人都可以以相同的方式从图像中识别的信息来统一生成标记信息，而不将与图像相关联的用户的独特的思维、感觉等反映为标记信息。

发明内容

技术问题

本公开提供了一种能够基于用户语音生成标记信息的电子装置及其控制方法。

解决问题的技术方案

根据实施例，一种电子装置的控制方法包括：显示包括至少一个对象的图像；接收语音；通过将语音输入到由人工智能(AI)算法训练的AI模型中，识别包括在图像中的至少一个对象中与语音相关联的对象，并获得识别的对象的标记信息；以及提供获得的标记信息。

根据实施例，一种电子装置包括显示器、麦克风、被配置为存储计算机可执行指令的存储器、以及处理器，该处理器被配置为执行该计算机可执行指令、以控制显示器显示包括至少一个对象的图像，通过将通过麦克风接收到的语音输入到由AI算法训练的AI模型来识别包括在语音中的至少一个对象中与语音相关联的对象，获得识别的对象的标记信息，并且提供获得的标记信息。

附图说明

图1是根据实施例的基于语音生成标记信息的电子装置的使用图；

图2是示出根据实施例的电子装置的配置的框图；

图3是示出与通过电子装置执行标记功能相关的各种实施例的视图；

图4是示出与通过电子装置执行标记功能相关的各种实施例的视图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三星电子株式会社，未经三星电子株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201980010152.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]电子装置及其控制方法在审

专利文献下载