[发明专利]一种数据处理方法、装置及存储介质有效
申请号: | 201910528253.9 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110223718B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 谢军 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G11B27/031 | 分类号: | G11B27/031;G11B27/10;G06K9/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
采集视频数据;所述视频数据包含用户背诵时的图像数据和音频数据;
对所述图像数据和音频数据分别进行分段处理,将分段处理后的图像数据和音频数据进行组合,得到至少两组数据;
针对所述至少两组数据中的每组数据,判断相应组数据是否满足第一预设条件;
当确定相应组数据满足第一预设条件时,基于采集时间在相应组数据之前的组数据以及采集时间在相应组数据之后的组数据,确定用户不熟悉的内容;
其中,所述对所述图像数据和音频数据分别进行分段处理,将分段处理后的图像数据和音频数据进行组合,得到至少两组数据,包括:
确定至少两个时间锚点;
利用所述至少两个时间锚点,对所述图像数据进行分段处理,得到至少两个图像数据;利用所述至少两个时间锚点,对所述音频数据进行分段处理,得到至少两个音频数据;
将时间锚点相同的图像数据和音频数据进行组合,得到至少两组数据。
2.根据权利要求1所述的方法,其特征在于,所述针对所述至少两组数据中的每组数据,判断相应组数据是否满足第一预设条件,包括:
针对所述至少两组数据中的每组数据,对相应组数据包含的图像数据进行特征提取,得到第一特征数据;对相应组数据包含的音频数据进行特征提取,得到第二特征数据;
确定所述第一特征数据满足第二预设条件且所述第二特征数据满足第三预设条件;
确定所述第一特征数据满足第二预设条件且所述第二特征数据满足第三预设条件时,确定相应组数据满足第一预设条件。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一特征数据满足第二预设条件,包括:
基于所述第一特征数据,以及预设面部识别模型,得到用户表情;
将所述用户表情与预设表情相匹配,得到匹配结果;
当所述匹配结果表征所述用户表情与预设表情匹配时,确定所述第一特征数据满足第二预设条件。
4.根据权利要求2所述的方法,其特征在于,所述确定所述第二特征数据满足第三预设条件,包括:
基于所述第二特征数据,以及预设语音识别模型,得到第一识别结果;
基于所述第一识别结果,统计用户背诵过程中的错误率;
确定统计的错误率大于预设阈值;
当确定统计的错误率大于预设阈值时,确定所述第二特征数据满足第三预设条件。
5.根据权利要求1所述的方法,其特征在于,所述基于采集时间在相应组数据之前的组数据以及采集时间在相应组数据之后的组数据,确定用户不熟悉的内容,包括:
针对采集时间在相应组数据之前的第一组数据,基于所述第一组数据包含的音频数据对应的特征数据,以及预设语音识别模型,得到第二识别结果;
针对采集时间在相应组数据之后的第二组数据,基于所述第二组数据包含的音频数据对应的特征数据,以及预设语音识别模型,得到第三识别结果;
确定所述第二识别结果对应的第一文本内容与预设背诵文本内容相匹配且所述第三识别结果对应的第二文本内容与预设背诵文本内容相匹配;
基于所述第一文本内容、第二文本内容,确定用户不熟悉的内容。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述用户不熟悉的内容,生成提示消息;所述提示消息用于提示用户背诵出错;
输出所述提示消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910528253.9/1.html,转载请声明来源钻瓜专利网。