[发明专利]一种数据处理方法、装置及计算机存储介质在审
申请号: | 201910819017.2 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110597989A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 张振伟 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本数据 知识数据 分片数据 分类标签 用户阅读 终端应用 知识库 计算机存储介质 数据处理技术 接收终端 应用发送 预存数据 数据处理 知识点 发送 归纳 查找 申请 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
接收终端应用发送的文本数据,其中所述文本数据为终端应用中显示的文本数据;
将文本数据进行分片得到分片数据;
将分片数据与知识库内的预存数据进行对比,从所有分片数据中确定出知识数据,并确定每一个知识数据的分类标签;
向所述终端应用发送所述知识数据以及所述知识数据的分类标签。
2.如权利要求1所述的方法,其特征在于,所述接收终端应用发送的文本数据,包括:
接收所述终端应用发送的N份文本数据,以及每一份文本数据的用户行为数据,N≥1;
所述将所述文本数据进行分片得到分片数据,包括:
根据用户行为数据,从所述N份文本数据中确定出有效数据;
针对任一有效数据,将所述有效数据进行分片得到分片数据。
3.如权利要求1所述的方法,其特征在于,所述知识库内的预存数据按设定规则分类存储;所述将分片数据与知识库内的预存数据进行对比,从所有分片数据中确定出知识数据,并确定每一个知识数据的分类标签,包括:
针对任一分片数据,将所述分片数据与知识库内的所有预存数据进行相似度匹配,确定最高相似度值,以及确定与所述分片数据具有最高相似度值的预存数据所在的分类;
将最高相似度值大于相似度阈值的分片数据作为知识数据,并将与所述知识数据具有最高相似度值的预存数据所在的分类标签,作为所述知识数据的分类标签。
4.如权利要求1所述的方法,其特征在于,所述向所述终端应用发送所述知识数据以及所述知识数据的分类标签,包括:
接收所述终端应用发送的知识数据获取请求;
向所述终端应用发送知识数据获取响应,所述知识数据获取响应包括所述知识数据以及所述知识数据的分类标签。
5.如权利要求1至4任一项所述的方法,其特征在于,所述接收所述终端应用发送的知识数据显示请求之后,还包括:
统计历史时间段内,每一个分类标签下知识数据的数量;
确定对应知识数据的数量最多的分类标签,并基于所述知识数据的数量最多的分类标签确定用户标签;
向所述终端应用发送所述用户标签。
6.一种数据处理方法,其特征在于,所述方法包括:
终端应用响应于用户的数据处理请求,记录显示的文本数据;
确定知识数据以及所述知识数据的分类标签,所述知识数据以及所述知识数据的分类标签为将所述文本数据进行分片得到分片数据,并将分片数据与知识库内的预存数据进行对比确定的;
将所述知识数据在所述知识数据的分类标签下进行显示。
7.如权利要求6所述的方法,其特征在于,所述确定知识数据以及所述知识数据的分类标签,包括:
从所述文本数据中确定出有效数据;
针对任一有效数据,将所述有效数据进行分片得到分片数据;
将分片数据与所述知识库内的预存数据进行对比,从所有分片数据中确定出知识数据,并确定每一个知识数据的分类标签。
8.一种数据处理装置,其特征在于,所述装置包括:
收发单元,用于接收终端应用发送的文本数据其中所述文本数据为终端应用中显示的文本数据,;
分片单元,用于将文本数据进行分片得到分片数据;
对比单元,用于将分片数据与知识库内的预存数据进行对比,从所有分片数据中确定出知识数据,并确定每一个知识数据的分类标签;
所述收发单元,还用于向所述终端应用发送所述知识数据以及所述知识数据的分类标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910819017.2/1.html,转载请声明来源钻瓜专利网。