[发明专利]数据处理方法、装置、介质及电子设备在审
申请号: | 202010231535.5 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111209403A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 常谦;李夫路 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/335 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;郑特强 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 介质 电子设备 | ||
1.一种数据处理方法,其特征在于,包括:
获取历史培训数据,所述历史培训数据包括历史实例;
将各历史培训数据归类至相应的预设主题,每个所述预设主题中包括至少两个模块;
从所述预设主题中确定当前培训数据所属的目标主题;
自所述目标主题的每个模块中各选取一个历史实例组成历史实例组;
根据所述历史实例组生成所述当前培训数据的推荐培训数据。
2.根据权利要求1所述的方法,其特征在于,将各历史培训数据归类至相应的预设主题包括:
将各历史培训数据的历史实例归类至相应的预设主题下的相应模块。
3.根据权利要求2所述的方法,其特征在于,每个所述历史实例具有相应的历史反馈数据;自所述目标主题的每个模块中各选取一个历史实例组成历史实例组,包括:
自所述目标主题的每个模块中各选取历史反馈数据最高的第一目标历史实例组成所述历史实例组。
4.根据权利要求2所述的方法,其特征在于,每个所述历史实例具有相应的历史反馈数据,所述当前培训数据包括当前实例;其中,从所述预设主题中确定所述当前培训数据所属的目标主题后,所述方法还包括:
确定所述当前实例在所述目标主题下所属的目标模块;
将所述目标模块下的历史实例分别与所述当前实例进行比较,得到与所述当前实例相似度最大的第二目标历史实例;
根据所述第二目标历史实例的历史反馈数据确定所述当前实例的当前反馈数据。
5.根据权利要求4所述的方法,其特征在于,将所述目标模块下的历史实例分别与所述当前实例进行比较,得到与所述当前实例相似度最大的第二目标历史实例之后,所述方法还包括:
根据所述第二目标历史实例提供所述当前实例的修改建议。
6.根据权利要求4所述的方法,其特征在于,所述将所述目标模块下的历史实例分别与所述当前实例进行比较,包括:
提取所述当前实例和所述历史实例中的关键字和关键字词频;
根据所述当前实例和所述历史实例的关键字词频分别获取所述当前实例和所述历史实例词频排名前N的关键字,生成所述当前实例和所述历史实例的关键字向量,其中N为自然数且N≥1;
根据所述当前实例的关键字向量和所述历史实例的关键字向量的余弦相似度确定与所述当前实例相似度最大的历史实例。
7.根据权利要求1所述的方法,其特征在于,所述获取历史培训数据之前,所述方法还包括:
将所述历史培训数据上传到区块链网络中。
8.一种数据处理装置,其特征在于,包括:
获取单元,用于获取历史培训数据,所述历史培训数据包括历史实例;
归类单元,用于将各历史培训数据归类至相应的预设主题,每个所述预设主题中包括至少两个模块;
第一确定单元,用于从所述预设主题中确定当前培训数据所属的目标主题;
选取单元,用于自所述目标主题的每个模块中各选取一个历史实例组成历史实例组;
生成单元,用于根据所述历史实例组生成所述当前培训数据的推荐培训数据。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010231535.5/1.html,转载请声明来源钻瓜专利网。