[发明专利]人工智能跟读方法和跟读机器人在审
申请号: | 202011087529.3 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112230875A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 朱定局 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G06N3/00;G06N3/08;G09B5/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 关志琨 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工智能 方法 机器人 | ||
1.一种人工智能方法,其特征在于,所述方法包括:
指令获取步骤:获取用户的指令;指令包括模式、交互方式、范围的相关指示;
指令模式步骤:根据指令的模式和范围确定待阅读的文本内容和第一音频;
指令交互步骤:根据指令的交互方式确定第二音频和第三音频;
资料获取步骤:获取学习资料;
学习步骤:若所述指令为第一预设指令或第二预设指令,则从学习资料文本中搜索与最近的至少一个用户读错的文本内容或用户读错率高于预设比例的待阅读的文本内容匹配的文本内容,作为待阅读的文本内容;若所述指令为第三预设指令,则继续将所述匹配的文本内容的后续文本内容,作为待阅读的文本内容。
2.根据权利要求1所述的人工智能方法,其特征在于,指令模式步骤包括:
模式选择步骤:若指令包括跟读含义,则执行跟读模式步骤;若未获取到指令,且识别出图像中用户所指向的位置在待阅读的文本内容之外,则执行缺省模式步骤;若所述指令包括继续含义,则执行继续模式步骤;
跟读模式步骤:根据指令识别图像中用户所指向的位置所在指令所指示的范围中的文本内容,作为待阅读的文本内容,将待阅读的文本内容转换为第一音频;
缺省模式步骤:将前一次指令作为当前的所述指令,然后转到指令模式步骤继续执行;
继续模式步骤:获取待阅读的文本内容后续的所在预设范围中的文本作为待阅读的文本内容,将待阅读的文本内容转换为第一音频。
3.根据权利要求2所述的人工智能方法,其特征在于,指令交互步骤包括:
交互选择步骤:若指令为“我跟你读”方面的指示,则执行我跟你读步骤;若指令为“你跟我读”方面的指示,则执行你跟我读步骤;若指令为“我们一起读”方面的指示,则执行我们一起读模式步骤;
我跟你读步骤:播放第一音频;在第一音频播放结束后,获取用户跟读的音频,作为第二音频;根据第一音频和第二音频,得到用户读错的文本内容,作为待阅读的文本内容,将待阅读的文本内容转换为第三音频,播放第三音频;
你跟我读步骤:获取用户的音频,作为第二音频;第二音频获取完成后,播放第一音频;根据第一音频和第二音频,得到用户读错的文本内容,作为待阅读的文本内容,将待阅读的文本内容转换为第三音频,播放第三音频;
我们一起读模式步骤:获取音频的单位,实时获取用户的当前单位音频,作为第二音频的当前单位部分;获取第二音频的前一单位部分对应的待阅读的文本内容中的单位内容相邻的后一单位内容,作为第一内容,将第一内容转换为音频,作为第一音频的当前部分;在实时获取用户的第二音频的当前部分的同时,播放第一音频的当前部分;根据第一音频和第二音频,得到用户读错的文本内容,作为待阅读的文本内容,将待阅读的文本内容转换为第三音频,播放第三音频。
4.根据权利要求2所述的人工智能方法,其特征在于,指令模式步骤还包括:
获取图像步骤:获取未被遮挡的第一图像和所述第一图像对应的被指后的第二图像;将所述第二图像作为指令模式步骤中的所述图像;
显示步骤:显示待阅读的文本内容;
文本识别步骤:在训练和测试时,将未被遮挡的第一图像和所述第一图像对应的被指后的第二图像作为输入,将第二图像中的用户所指向的位置所在指令所指示的范围中的文本内容作为输出,对深度学习模型进行训练和测试,得到的所述深度学习模型,作为有遮挡图像文本识别深度学习模型;在使用时,将未被遮挡的第一图像和所述第一图像对应的被指后的第二图像作为输入,通过有遮挡图像文本识别深度学习模型计算得到的输出作为第二图像中的用户所指向的位置所在指令所指示的范围中的文本内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011087529.3/1.html,转载请声明来源钻瓜专利网。