[发明专利]用户消费标签提取方法及装置在审
申请号: | 202210124415.4 | 申请日: | 2022-02-10 |
公开(公告)号: | CN114461803A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 吕朝辉;罗涛;施佳子;于海燕 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06K9/62;G06Q30/02;G06Q30/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 崔博;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 消费 标签 提取 方法 装置 | ||
本发明实施例公开了一种用户消费标签提取方法及装置,可用于金融领域或其他技术领域,该方法包括:获取目标用户的消费数据;将所述消费数据输入到预设的消费关键词提取模型中,得到所述消费关键词提取模型输出的所述消费数据对应的消费关键词;将所述消费关键词输入到预设的聚类模型中,得到所述聚类模型输出的所述目标用户的用户消费标签。本发明实现了准确高效的确定出用户的消费标签的有益效果。
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及一种用户消费标签提取方法及装置。
背景技术
在如今的商业时代,大数据越发凸显其价值,企业迫切地需要从海量的数据中挖掘出用户的需求,以更好的为用户服务。基于用户消费行为的用户消费标签提取能够帮助企业对用户进行精准化服务、个性化营销和特色推荐。
现有的常见的标签分类标准会将用户消费类数据分为两级标签,大类标签和小类标签。但是两级标签都存在明显的缺陷。以大类标签为例可将消费标签划分为办公、购物、餐饮、休闲娱乐等19个大类,但这些划分较为综合,无法直观获取用户的偏好等信息。而小类标签较为精细,可将数据划分为打车、单车、电影、数码电器等100个小类标签,行业二级分类会出现分类交叉和标签分类错误(这主要是因为吃词问题和中文歧义问题造成的)等问题。由此可见,采用大类标签和小类标签作为用户消费标签均存在相应的缺陷,现有技术缺少一种更为准确并且更能反应出用户的消费偏好的消费标签提取方法。
发明内容
本发明为了解决上述背景技术中的至少一个技术问题,提出了一种用户消费标签提取方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种用户消费标签提取方法,该方法包括:
获取目标用户的消费数据;
将所述消费数据输入到预设的消费关键词提取模型中,得到所述消费关键词提取模型输出的所述消费数据对应的消费关键词;
将所述消费关键词输入到预设的聚类模型中,得到所述聚类模型输出的所述目标用户的用户消费标签。
可选的,所述将所述消费关键词输入到预设的聚类模型中,具体包括:
将所述消费关键词转化为词向量;
将所述词向量输入到所述聚类模型中。
可选的,该用户消费标签提取方法,还包括:
获取训练样本,其中,所述训练样本为标注出消费关键词的消费数据;
根据所述训练样本对预设的Bert模型进行训练,得到所述消费关键词提取模型。
可选的,所述将所述消费关键词转化为词向量,具体包括:
将所述消费关键词输入到预设的word2vec模型中,得到词向量。
可选的,在所述将所述消费数据输入到预设的消费关键词提取模型中之前,还包括:
对所述消费数据进行预处理,其中,所述预处理包括:去除空值以及去除重复值。
可选的,所述聚类模型包括:K-means模型。
为了实现上述目的,根据本发明的另一方面,提供了一种用户消费标签提取装置,该装置包括:
消费数据获取单元,用于获取目标用户的消费数据;
消费关键词提取单元,用于将所述消费数据输入到预设的消费关键词提取模型中,得到所述消费关键词提取模型输出的所述消费数据对应的消费关键词;
用户消费标签确定单元,用于将所述消费关键词输入到预设的聚类模型中,得到所述聚类模型输出的所述目标用户的用户消费标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210124415.4/2.html,转载请声明来源钻瓜专利网。