[发明专利]基于数据源的业务定制装置、方法及计算机可读存储介质有效
申请号: | 201710313995.0 | 申请日: | 2017-05-05 |
公开(公告)号: | CN107038256B | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 王健宗;黄章成;吴天博;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据源 业务定制 用户群体 计算机可读存储介质 业务定制系统 用户生成内容 存储器 群体 处理器 标签 处理器执行 标签识别 映射关系 存储 终端 | ||
1.一种基于数据源的业务定制装置,其特征在于,所述基于数据源的业务定制装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于数据源的业务定制系统,所述基于数据源的业务定制系统被所述处理器执行时实现如下步骤:
S1,获取预定的各数据源中的用户生成内容;
S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制;
所述用户群体标签识别模型基于最大熵准则进行建立,所述用户群体标签识别模型的模型函数包括用户行为属性分布函数,用户行为属性分布函数用以描述各用户对应的行为属性的概率分布状况,所述用户行为属性分布函数为:
x为用户,y为用户标签,fj(x,y)为用户x的第j个特征的属性,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布,Z(x)是正规化因子;
所述基于数据源的业务定制系统被所述处理器执行步骤S1之前,还包括:
S01,获取预设数量的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;
S02,将所述群体数据样本分为预设的第一比例的训练集及预设的第二比例的验证集,所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值,则模型训练结束,以训练后的用户群体标签识别模型作为所述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,并基于增加后的数据源重新进行训练。
2.根据权利要求1所述的基于数据源的业务定制装置,其特征在于,所述用户群体标签识别模型的模型函数还包括最优化函数,所述最优化函数为:
p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,为用户的行为属性的似然函数,为正则化因子,β为控制所述最优化函数正则化程度的参数。
3.根据权利要求1或2所述的基于数据源的业务定制装置,其特征在于,所述用户群体标签识别模型的识别过程包括对所述用户的行为属性的概率分布进行求解迭代,以及在每一迭代的过程中还包括微分模式迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710313995.0/1.html,转载请声明来源钻瓜专利网。