[发明专利]一种数据处理方法、装置和用于数据处理的装置在审
申请号: | 201910209610.5 | 申请日: | 2019-03-19 |
公开(公告)号: | CN111723606A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 刘文文;刘雁 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G09B5/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 用于 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
若确定接收到识别指令,则获取当前场景对应的场景图像;
识别所述场景图像中的物体对象;
输出所述物体对象对应于目标语言的语音。
2.根据权利要求1所述的方法,其特征在于,在所述输出所述物体对象对应于目标语言的语音之后,所述方法还包括:
接收所述语音对应的跟读语音;
确定所述跟读语音与所述语音之间的相似度;
根据所述相似度,确定所述跟读语音对应的评价信息;
输出所述跟读语音对应的评价信息。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述相似度,确定所述跟读语音对应的评价信息之后,所述方法还包括:
若所述跟读语音与所述语音的相似度小于预设相似度,则输出重新跟读的提示信息;
接收重新跟读的跟读语音;
若重新跟读的次数达到预设次数,则停止输出重新跟读的提示信息,以及记录所述场景图像和所述语音。
4.根据权利要求1所述的方法,其特征在于,在所述输出所述物体对象对应的语音之前,所述方法还包括:
确定当前用户的相关信息,其中,所述相关信息至少包括如下信息中的任意一项:用户的年龄、偏好、历史跟读记录;
所述输出所述物体对象对应于目标语言的语音,包括:
根据所述相关信息,确定语音的类型;其中,所述语音的类型包括:词语、句子、对话、段落对应的音频或视频;
根据所述语音的类型,输出所述物体对象对应于目标语言的语音。
5.根据权利要求1所述的方法,其特征在于,所述确定接收到识别指令,包括:
若检测到当前场景在所述摄像头中保持的时间超过预设时间长度,则确定接收到识别指令。
6.根据权利要求1所述的方法,其特征在于,所述识别所述场景图像中的物体对象,包括:
根据物体识别模型,识别所述场景图像中的物体对象;其中,所述物体识别模型为根据样本图像、以及所述样本图像对应的标注结果训练得到的深度神经网络模型。
7.根据权利要求1至6中任一所述的方法,其特征在于,所述场景图像包括:所述摄像头对当前场景拍摄的照片,或者,所述摄像头对当前场景拍摄的视频中的图像帧。
8.一种数据处理装置,其特征在于,包括:
图像获取模块,用于若确定接收到识别指令,则获取当前场景对应的场景图像;
物体识别模块,用于识别所述场景图像中的物体对象;
语音输出模块,用于输出所述物体对象对应于目标语言的语音。
9.一种用于数据处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
若确定接收到识别指令,则获取当前场景对应的场景图像;
识别所述场景图像中的物体对象;
输出所述物体对象对应于目标语言的语音。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910209610.5/1.html,转载请声明来源钻瓜专利网。