[发明专利]一种用户标签的预测方法及系统有效
申请号: | 202110822167.6 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113283235B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 姚娟娟;钟南山 | 申请(专利权)人: | 明品云(北京)数据科技有限公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 上海汉之律师事务所 31378 | 代理人: | 冯华 |
地址: | 102400 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 标签 预测 方法 系统 | ||
1.一种用户标签的预测方法,其特征在于,包括:
获取用户文本集和预设的关键词库,所述用户文本集中包括多个用户文本,所述关键词库包括多个关键词;
通过关键词获取一用户文本中的各个近似词,按照关联度的大小,获取排名前m的近似词所对应的关键词,并确定所述对应的关键词匹配的n维向量,通过m个所述n维向量确定特征矩阵,其中,m和n均为正整数;
将多个用户文本分别对应的特征矩阵输入神经网络进行训练,获取预测模型;
通过预测模型预测待处理的用户文本,获取预测的用户标签;
定义L为关联度,关键词的n维向量为(X1、……、Xi、……、Xn),近似词的n维向量为(Y1、……、Yi、……、Yn);
当Xi和Yi不相等时,关联度的数学表达为:
当Xi=Yi时,关联度为1。
2.根据权利要求1所述的用户标签的预测方法,其特征在于,将获取的用户标签与m个n维向量相匹配,获取关联度小于1的各个近似词,并确定为近似词集;
将获取一用户标签的各个近似词集,并从各个所述近似词集中确定交集;
将所述交集对应的近似词更新为所述关键词库中的关键词。
3.根据权利要求2所述的用户标签的预测方法,其特征在于,包括:
通过更新后的关键词库中的关键词,确定更新后的用户文本中的各个近似词汇;
按照关联度的大小,获取排名前m的近似词所对应的更新后的关键词,并确定所述更新后的关键词匹配的n维向量,通过m个所述n维向量确定更新后的特征矩阵;
将多个用户文本分别对应的更新后的特征矩阵输入神经网络进行训练,获取更新后的预测模型;
通过所述更新后的预测模型预测待处理的用户文本,获取更新后的用户标签。
4.一种用户标签的预测系统,其特征在于,包括:
预处理模块,用于获取用户文本集和预设的关键词库,所述用户文本集中包括多个用户文本,所述关键词库包括多个关键词,通过关键词获取一用户文本中的各个近似词,按照关联度的大小获取排名前m的近似词所对应的关键词,并确定所述对应的关键词匹配的n维向量,通过m个所述n维向量确定特征矩阵,其中,m和n均为正整数,定义L为关联度,关键词的n维向量为(X1、……、Xi、……、Xn),近似词的n维向量为(Y1、……、Yi、……、Yn);
当Xi和Yi不相等时,关联度的数学表达为:
当Xi=Yi时,关联度为1;
模型模块,用于将多个用户文本分别对应的特征矩阵输入神经网络进行训练,获取预测模型;
处理模块,用于通过预测模型处理待处理的用户文本,获取预测的用户标签;
所述预处理模块、所述模型模块以及所述处理模块之间信号连接。
5.根据权利要求4所述的用户标签的预测系统,其特征在于,预处理模块将获取的用户标签与m个n维向量相匹配,获取关联度小于1的各个近似词,并确定为近似词集;
将获取一用户标签的各个近似词集,并从各个所述近似词集中确定交集;
将所述交集对应的近似词更新为所述关键词库中的关键词。
6.根据权利要求5所述的用户标签的预测系统,其特征在于,模型模块通过更新后的关键词库中的关键词,确定更新后的用户文本中的各个近似词汇;按照关联度的大小,获取排名前m的近似词所对应的更新后的关键词,并确定所述更新后的关键词匹配的n维向量,通过m个所述n维向量确定更新后的特征矩阵;将多个用户文本分别对应的更新后的特征矩阵输入神经网络进行训练,获取更新后的预测模型;
处理模块通过所述更新后的预测模型预测待处理的用户文本,获取更新后的用户标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于明品云(北京)数据科技有限公司,未经明品云(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110822167.6/1.html,转载请声明来源钻瓜专利网。