[发明专利]应用开启方法、装置、设备及计算机可读介质在审
申请号: | 201810298095.8 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108563330A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 路双;佟莎莎;杨锐 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/0484;G06F3/0487;G06F9/451 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;王珺 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 眼球 页面区域 应用 计算机可读介质 注视方向 保密性 放大处理 开启操作 用户提供 页面 放大 图像 检测 | ||
本发明提出一种应用开启方法、装置、设备及计算机可读介质,该方法包括:在包括眼球的图像中检测所述眼球的注视方向;根据所述眼球的注视方向在当前页面中定位对应的页面区域,对所述页面区域进行放大处理;在放大后的页面区域内,确定出需要开启的应用;开启所述应用。本发明实施例可以通过眼球的方式进行应用的开启操作,为用户提供便捷操作方式,同时还可以增强保密性。
技术领域
本发明涉及自动开启的技术领域,尤其涉及一种应用开启方法及装置、设备和计算机可读介质。
背景技术
随着计算机技术以及数据处理技术的发展,语音识别技术应运而生。语音识别技术是一种让机器把语音信号转变为相应的文字的方法,它已经应用到日常生活的方方面面。比如基于语音识别的车载导航系统、Siri(苹果智能语音助手)等。
语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。首先通过麦克风采集包含用户声音的音频信号,接着对该音频信号进行降噪处理和模数转换获得数字信号,然后提取数字信号中的特征参数,将数字信号中的特征参数与文字特征参数库中的信息进行匹配,查找出该音频信号对应的文字,最后根据文字代表的内容执行相应的操作。
然而,为了保证获取的数字信号的特征参数能够代表用户声音的特征,用户声音的音量必须不小于能够提取出用户声音特征的音量,在公共场所容易泄露用户隐私,使得保密性差。
发明内容
本发明实施例提供一种应用开启方法、装置、设备及计算机可读介质,以解决或缓解现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种应用开启方法,包括:
在包括眼球的图像中检测所述眼球的注视方向;
根据所述眼球的注视方向在当前页面中定位对应的页面区域,对所述页面区域进行放大处理;
在放大后的页面区域内,确定出需要开启的应用;
开启所述应用。
结合第一方面,本发明在第一方面的第一种实施方式中,在放大后的页面区域内,确定出需要开启的应用;
判断放大后的页面区域内是否仅存在一个应用;
若仅存在一个应用,则该应用为需要开启的应用;
若存在多个应用,则返回重新继续执行步骤:在包括眼球的图像中检测所述眼球的注视方向。
结合第一方面,本发明在第一方面的第二种实施方式中,所述根据所述眼球的注视方向在当前页面中定位对应的页面区域,对所述页面区域进行放大处理的步骤中,包括:
将当前页面划分为多个页面区域,每个页面区域中至少包含一个应用;
弹出眼球注视方向上的页面区域,并进行放大处理,覆盖当前页面。
结合第一方面的第二种实施方式,本发明在第一方面的第三种实施方式中,还包括步骤:
如果根据包括眼球的图像检测得到连续眨眼状态,则关闭当前弹出的页面区域。
结合第一方面的第二种实施方式,本发明在第一方面的第四种实施方式中,还包括步骤:
如果根据包括眼球的图像检测得到单次眨眼状态,则将当前弹出的页面区域切换为弹出另一个页面区域。
第二方面,本发明实施例提供了一种应用开启装置,包括:
检测模块,用于在包括眼球的图像中检测所述眼球的注视方向;
定位放大模块,用于根据所述眼球的注视方向在当前页面中定位对应的页面区域,并对所述页面区域进行放大处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810298095.8/2.html,转载请声明来源钻瓜专利网。