[发明专利]一种确定样本标签的方法及装置在审
申请号: | 202210349705.9 | 申请日: | 2022-04-02 |
公开(公告)号: | CN114708097A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 胡婧茹;冯坤炎 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q20/40;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 彭燕 |
地址: | 518027 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 样本 标签 方法 装置 | ||
本发明实施例涉及机器学习技术领域,尤其涉及一种确定样本标签方法及装置。该方法包括:从连续时长的交易数据中划分出时长相同且具有时段属性的多个待标注样本;针对任一待标注样本,在待标注样本的时段属性为波动型时,根据待标注样本的相邻样本对待标注样本进行波动修正;将与波动修正后的待标注样本的相似度满足第一预设条件的已标注样本的标签作为待标注样本的标签。将多个待标注样本与已经标注好的少量已标注样本进行相似度的计算,从而确定待标注样本的标签。无需人力操作,提高了标注的速度。通过相邻的且时段属性为非波动型的相邻样本对该待标注样本进行波动修正,弱化波动效应。得到的相似度更准确。
技术领域
本发明实施例涉及机器学习技术领域,尤其涉及一种确定样本标签的方法、装置、计算设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。
在业务运维领域,经常需要根据业务一段时间的交易数据确定业务状态是否异常以及具体的异常时间。一般的做法是训练一个模型,将一段时间的交易数据输入该模型,该模型给出该段时间内的交易数据是否正常的结论。
模型的训练需要大量带有标签的样本,包括业务正常时上报的正样本和业务异常时上报的负样本。样本的标注工作全部由人力完成的话,无疑会耗费大量的人力,同时也会存在标注不准确的问题。
综上,提供一种确定样本标签的方法,提高样本标注的速度和准确度,节省人力。
发明内容
本发明实施例提供一种确定样本标签的方法,提高样本标注的速度和准确度,节省人力。
第一方面,本发明实施例提供一种确定样本标签的方法,包括:
从连续时长的交易数据中划分出时长相同且具有时段属性的多个待标注样本;其中,待标注样本的时段属性是根据待标注样本所属时段对应的日期类型确定的;所述日期类型是通过日期对交易数据的波动效应进行划分的;
针对任一待标注样本,在所述待标注样本的时段属性为波动型时,根据所述待标注样本的相邻样本对所述待标注样本进行波动修正;其中,所述相邻样本为交易时间与所述待标注样本相邻且时段属性为非波动型的样本;
将与波动修正后的待标注样本的相似度满足第一预设条件的已标注样本的标签作为所述待标注样本的标签。
通过对连续时长的交易数据进行划分,得到多个待标注样本,将多个待标注样本与已经标注好的少量已标注样本进行相似度的计算,从而确定待标注样本的标签。无需人力操作,提高了标注的速度。具体地,根据待标注样本所属时段对应的日期类型确定待标注样本的时段属性,充分考虑了不同的日期类型之间交易数据的差异。若待标注样本的时段属性为波动型时,则说明该待标注样本的交易数据本身具有波动效应。因此需要通过相邻的且时段属性为非波动型的相邻样本对该待标注样本进行波动修正,从而弱化波动效应。将与波动修正后的待标注样本的相似度满足第一预设条件的已标注样本的标签作为所述待标注样本的标签,得到的相似度更加准确。
可选地,从连续时长的交易数据中划分出时长相同且具有时段属性的多个待标注样本,包括:
在连续时长的交易数据中,将具有相同的时段属性的交易数据按照交易时间的先后顺序进行拼接,得到多段拼接交易数据;
针对任一段拼接交易数据,划分出时长相同的多个待标注样本。
如此得到的任一待标注样本中包含的时间段均具有相同的时段属性。
可选地,根据所述待标注样本的相邻样本对所述待标注样本进行波动修正,包括:
确定所述待标注样本中交易数据存在突变的各突变时刻;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210349705.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能家居系统
- 下一篇:一种基于MEMS多信息融合的脑卒中患者监测平台