[发明专利]一种训练标记预测模型的方法和系统有效
申请号: | 202010072725.7 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111274376B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 方军鹏 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 标记 预测 模型 方法 系统 | ||
本说明书实施例公开了一种训练标记预测模型的方法和系统。所述方法包括:获取多个样本,多个样本合计包含P个不同的标记,P为≥2的整数;从P个不同的标记中任选两个标记,生成(P(P‑1))/2个标记对;从多个样本中选取标记对(x,y)对应的第一样本和第二样本;第一样本包含第一标记x,第二样本包含第二标记y;第一样本组成第一样本集,第二样本组成第二样本集;计算选取的样本分别与两个样本集各自中心的距离,将该距离作为所述选取的样本的新特征;基于附加了新特征的选取的样本训练二分类器,得到用于预测所述标记对(x,y)中标记的二分类器,将(P(P‑1))/2个二分类器组成标记预测模型。
技术领域
本申请涉及数据处理领域,特别涉及一种训练标记预测模型方法和系统。
背景技术
随着互联网的快速发展,智能客服机器人在各个领域的线上平台上起到了举足轻重的作用。通常,用户输入某个内容以后,智能客服机器人可以通过机器学习方法猜测用户的问题,并对问题进行解答,提高用户体验。若针对用户输入的问题只给出一个回答或者一个问题时,机器学习只需学习数据的一个标记即可。
然而,大多数情况下用户遇到的问题不止一个,智能客服机器人需要基于用户输入的内容猜测多个疑问或/和答案。例如,某购物平台,用户输入“开通会员”,用户的疑问可能是“开通会员的条件”、“开通会员的流程”或/和“开通会员后的优惠”等。因此,亟需一种对数据(例如,用户输入的内容)进行多标记学习的方法,从而能够准确预测数据的多个标记。
发明内容
本说明书一个方面提供一种训练标记预测模型的方法。所述方法包括:获取多个样本,所述多个样本合计包含P个不同的标记,P为大于等于2的整数;从所述P个不同的标记中任选两个标记,生成(P(P-1))/2个标记对;从所述多个样本中选取标记对(x,y)对应的第一样本和第二样本;所述第一样本包含第一标记x,所述第二样本包含第二标记y;所述第一样本组成第一样本集,所述第二样本组成第二样本集;计算选取的样本分别与两个样本集各自中心的距离,将所述距离作为所述选取的样本的新特征;基于附加了所述新特征的所述选取的样本训练二分类器,得到用于预测所述标记对(x,y)中标记的二分类器,将(P(P-1))/2个二分类器组成标记预测模型。
本说明书另一个方面提供一种训练标记预测模型的系统。所述系统包括:样本获取模块,用于获取多个样本,所述多个样本合计包含P个不同的标记,P为大于等于2的整数;标记对生成模块,用于从所述P个不同的标记中任选两个标记,生成(P(P-1))/2个标记对;样本选取模块,用于从所述多个样本中选取标记对(x,y)对应的第一样本和第二样本;所述第一样本包含第一标记x,所述第二样本包含第二标记y;所述第一样本组成第一样本集,所述第二样本组成第二样本集;特征获取模块,用于计算选取的样本分别与两个样本集各自中心的距离,将所述距离作为所述选取的样本的新特征;标记预测模型生成模块,用于基于附加了所述新特征的所述选取的样本训练二分类器,得到用于预测所述标记对(x,y)中标记的二分类器,将(P(P-1))/2个二分类器组成标记预测模型。
本说明书另一个方面提供一种训练标记预测模型的装置,包括至少一个存储介质和至少一个处理器,所述存储介质用于存储计算机指令;所述处理器用于执行训练标记预测模型的方法。
本说明书另一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行训练标记预测模型的方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的训练标记预测模型系统的应用场景示意图;
图2是根据本说明书一些实施例所示的训练标记预测模型系统的模块图;
图3是根据本说明书一些实施例所示的训练标记预测模型方法的示例性流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010072725.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据传输方法及装置
- 下一篇:一种自动插入外接设备孔的方法及装置