[发明专利]基于机器学习的迁移数据确定方法、装置、设备及介质有效

专利信息
申请号: 201910637116.9 申请日: 2019-07-15
公开(公告)号: CN110377587B 公开(公告)日: 2023-02-10
发明(设计)人: 魏颖;黄俊洲 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F16/21 分类号: G06F16/21;G06F16/9032;G06F18/22;G06N20/00
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 邢少真
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 机器 学习 迁移 数据 确定 方法 装置 设备 介质
【说明书】:

发明公开了一种基于机器学习的迁移数据确定方法、装置、设备及介质,属于网络技术领域。包括:获取服务器分别向多个终端进行数据迁移的迁移过程数据;确定每个终端对应的个性化数据和每个终端的终端侧数据之间的相似度;基于相似度,确定多个终端的数据迁移性能指标;基于每个终端的数据迁移性能指标对待训练模型进行训练,获得迁移模型;响应于终端的迁移请求,基于迁移模型确定向终端迁移的数据。本发明通过获取服务器向多个终端进行数据迁移的迁移过程数据,基于机器学习对服务器侧的模型进行训练,获得针对于终端进行定制化的迁移模型,基于该迁移模型向终端高效迁移终端所需的数据,提高了迁移数据的准确性和效率,同时节省了大量人力。

技术领域

本发明涉及网络技术领域,特别涉及一种基于机器学习的迁移数据确定方法、装置、计算机设备及存储介质。

背景技术

目前,在特定的应用场景下,比如智能客服应用场景,该智能客服能够基于终端侧已有的用户对话记录分析出用户的特征,比如用户的兴趣、习惯以及语言模式等,当智能客服在与用户进行对话时,使得智能客服能够以符合用户的特征的方式与用户进行交互,实现智能客服的个性定制化。但是,由于终端侧所积累的用户对话记录的数据量非常小,无法对该智能客服进行训练,也就导致了智能客服无法以符合用户的特征的方式与用户进行交互。

在这种背景下,为了解决上述问题,从服务器侧向终端迁移对应的数据对终端侧的模型进行训练的迁移技术应运而生,具体的,通过在服务器上将所有终端的终端侧数据进行匿名汇总之后,在服务器侧进行模型训练,获得多个通用模型,再通过人工匹配的方式,从多个通用模型中确定出符合终端需求的模型,再基于该模型向终端迁移相应的数据,以解决终端侧数据量小而无法实现智能客服训练的问题。

在实现本发明的过程中,发明人发现上述迁移技术至少存在以下问题:

由于在服务器侧所训练好的模型是基于大量终端所积累的终端侧数据进行训练的,因此,所训练出的通用模型无法与特定的终端完全适配,导致通过该通用模型向终端所迁移的数据并不精确,使终端侧基于该迁移的数据所训练出的模型达不到预期目标;另外,通过人工的方式确定出与终端相匹配的模型需要耗费了大量的人力,效率不高。

发明内容

本发明实施例提供了一种基于机器学习的迁移数据确定方法、装置、设备及介质,可以解决现有技术中模型与终端不适配所导致的迁移数据不准确以及人工确定匹配模型所导致的耗费大量人力以及效率不高的问题。该技术方案如下:

一方面,提供了一种基于机器学习的迁移数据确定方法,方法包括:

获取服务器分别向多个终端进行数据迁移的迁移过程数据,迁移过程数据包括被迁移的个性化数据以及每个终端的终端侧数据;

确定每个终端对应的个性化数据和每个终端的终端侧数据之间的相似度;

基于相似度,确定多个终端的数据迁移性能指标;

基于每个终端的数据迁移性能指标对待训练模型进行训练,获得迁移模型,迁移模型用于从服务器的通用数据中确定出待迁移的个性化数据;

响应于终端的迁移请求,基于迁移模型确定向终端迁移的数据。

在本发明的一个实施例中,上述确定每个终端对应的个性化数据和每个终端的终端侧数据之间的相似度包括:

对每个终端对应的个性化数据和每个终端的终端侧数据进行非线性变换;

确定每个终端的非线性变换后的个性化数据和终端侧数据之间的相似度。

在本发明的一个实施例中,上述确定每个终端的非线性变换后的个性化数据和终端侧数据之间的相似度包括:

确定每个终端的非线性变换后的个性化数据和终端侧数据之间共有特征对应的数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910637116.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top