[发明专利]一种数据处理的方法及相关装置有效
申请号: | 201910420391.5 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110222168B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 郭鸿程 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/30;G06F40/289;G06V30/19 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 相关 装置 | ||
本发明涉及智能决策领域,提供一种数据处理的方法及相关装置。一种数据处理的方法包括:获取终端发送的书籍的图像数据;对图像数据进行字符识别处理以得到图像数据对应的文本数据;对文本数据进行文本类型检测以判断文本数据的文本类型是否满足预设文本类型;当文本类型满足预设文本类型时,将文本数据输入神经网络编码器以得到文本数据的摘要向量;将文本数据的摘要向量输入神经网络解码器以得到文本数据的摘要;提取文本数据的摘要中的N个关键词;将N个关键词进行组合以得到文本数据的问题;通过神经网络语义表示模型确定文本数据的问题对应的答案。本发明实施例的技术方案,提高了检验阅读效果的效率。
技术领域
本发明涉及智能决策领域,尤其涉及一种数据处理的方法及相关装置。
背景技术
目前,孩童或者学生阅读完书籍后,家长或者老师检验阅读效果的方法就是通过作业来确认,例如对于课本上的文章,孩童或者学生阅读完后往往需要做课后练习,家长或者老师通过课后练习来检验阅读效果。
但是,有时候孩童或者学生阅读的书籍后面没有对应的作业或者练习,如果要检验阅读效果,家长或者老师只有先看一遍书籍,了解书籍的内容,才能对孩童或者学生的阅读效果进行检验,这样,浪费了阅读书籍的时间,而且如果阅读的书籍很长,那么检验阅读效果的效率较低。
发明内容
本发明实施例提供一种数据处理的方法及相关装置,以提高检验阅读效果的效率。
本发明第一方面提供一种数据处理的方法,包括:
获取终端发送的书籍的图像数据;
对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
本发明第二方面提供了一种数据处理的装置,包括:
获取模块,用于获取终端发送的书籍的图像数据;
字符识别模块,用于对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
检测模块,用于对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
编码模块,用于当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
解码模块,用于将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910420391.5/2.html,转载请声明来源钻瓜专利网。