[发明专利]一种手动取词的方法及装置有效
申请号: | 202010338641.3 | 申请日: | 2020-04-26 |
公开(公告)号: | CN111242109B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 王洪伟;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/72;G06F40/58 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手动 方法 装置 | ||
本申请提供一种手动取词的方法及装置,用于取词模型,所述方法包括:获取目标图像,并对所述目标图像进行手部图像检测;在检测到所述目标图像包含手部图像的情况下,对所述手部图像进行指尖识别,确定指尖位置;确定所述指尖位置对应的候选区域,对所述指尖位置对应的候选区域进行处理,以生成目标词单元,从而实现根据手部的指尖精确定位至对应的词单元。
技术领域
本申请涉及人工智能技术领域,特别涉及一种手动取词的方法及装置、计算设备和计算机可读存储介质。
背景技术
随着词典的电子化普及,用户在日常工作或学习中对于电子词典的使用也越来越频繁。根据具体使用场景的不同,可以分为在电脑端和移动端的应用。
在电脑端,电子词典的使用一般采用鼠标取词的方式,即通过鼠标移动光标选中目标词单元,然后再复制到电子词典中进行查询。
在移动端,由于触摸屏的存在,可以在电子词典的应用任务中对屏幕进行取词,要比电脑端的取词操作简便得多。具体地,一般采用摄像头移动到指定位置,然后进行拍照—截图—识别—取词等操作,得到最终的词单元。此种方法只适用于识别摄像头的摄像范围内的词单元,无法准确地定位到单个词单元。
发明内容
有鉴于此,本申请实施例提供了一种手动取词的方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
本申请实施例提供了一种手动取词的方法,用于取词模型,所述方法包括:
获取目标图像,并对所述目标图像进行手部图像检测;
在检测到所述目标图像包含手部图像的情况下,对所述手部图像进行指尖识别,确定指尖位置;
确定所述指尖位置对应的候选区域,对所述指尖位置对应的候选区域进行处理,以生成目标词单元。
可选地,所述取词模型包括:图像识别模型和指尖识别模型;
对所述目标图像进行手部图像检测,包括:
将所述目标图像输入至所述图像识别模型进行手部图像检测;
在检测到所述目标图像包含手部图像的情况下,对所述手部图像进行指尖识别,确定指尖位置,包括:
在所述图像识别模型检测到所述目标图像包含手部图像的情况下,通过所述指尖识别模型对所述手部图像进行指尖识别,确定指尖位置。
可选地,在所述图像识别模型检测到所述目标图像包含手部图像的情况下,通过所述指尖识别模型对所述手部图像进行指尖识别,确定指尖位置,包括:
在所述图像识别模型检测到所述目标图像包含手部图像的情况下,确定所述手部图像对应的区域边框,其中,所述区域边框包围的区域图像包含所述手部图像;
通过所述指尖识别模型对所述区域边框包围的区域图像进行指尖识别,确定至少一个指尖位置。
可选地,确定所述指尖位置对应的候选区域,对所述指尖位置对应的候选区域进行处理,以生成目标词单元,包括:
确定所述指尖位置对应的候选区域,对所述指尖位置对应的候选区域进行文本检测,生成文本序列;
将所述文本序列进行词单元识别,并基于识别的词单元确定目标词单元。
可选地,所述取词模型还包括:文本检测模型;
确定所述指尖位置对应的候选区域,对所述指尖位置对应的候选区域进行文本检测,生成文本序列,包括:
将与所述指尖位置的距离位于第一阈值范围内的图像区域确定为候选区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010338641.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器硬盘免螺丝快拆结构
- 下一篇:一种施工现场混凝土实际强度测算方法