[发明专利]一种细粒度属性加权方法及系统在审
申请号: | 202010889448.9 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112148822A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 龚芳;蒋良孝;王欣;郭星锋;王典洪 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06K9/62 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 龚春来 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 细粒度 属性 加权 方法 系统 | ||
1.一种细粒度属性加权方法,其特征在于:包括以下步骤:
S101:获取对应活动区域所有兴趣点的用户签到数据集;所述用户签到数据集中包括多个用户在所述活动区域内的多个签到数据;每个所述签到数据包括多个属性值,每个属性值对应有一个类标;
S102:根据各属性值的物理意义,将各属性值分别进行细分;并将细分后的属性值对应的属性权值在属性值粒度上和类标粒度上细分;
S103:根据所述用户签到数据集的先验知识统计给各细粒度属性值对应不同类标下的细粒度属性权值设置初始值,得到初始值矩阵;
S104:将所述初始值矩阵作为随机重启游走中的初始状态矩阵;利用随机游走算法计算获得细粒度属性权值的最优值矩阵。
2.如权利要求1所述的一种细粒度属性加权方法,其特征在于:步骤S103中,根据所述用户签到数据集的先验知识统计给各细粒度属性值对应不同类标下的细粒度属性权值设置初始值,得到初始值矩阵;具体包括:
S201:根据数据集的先验知识统计,找出无依赖关系或者在有限用户签到数据下,没有呈现依赖关系的类标和属性值,并给它们对应的细粒度属性权值分配权值零;
S202:将缺失的属性值对应的所有细粒度属性权值分配权值零;其中,若用户到达某兴趣点的经纬度或者时间没有记录下来,则用户在该兴趣点的签到数据存在缺失属性值;
S203:计算其余的属性值与类标对应的类成员概率,并将其设置为对应细粒度属性权值的初始值。
3.如权利要求1所述的一种细粒度属性加权方法,其特征在于:步骤S203中,类成员概率P(ck|ail)计算公式如公式(1)所示:
上式中,P(ck|ail)表示第k个类标ck,第i个属性值的第l个细粒度属性值对应的类成员概率,将其设置为类标ck细粒度属性值ail对应的细粒度属性权值的初始值;l=1,2,…,S;S为第i个属性值细分后的细粒度属性值的总个数;j表示用户签到数据集D中的第j条签到数据,ai(j)表示第j条签到数据在第i个属性值上的属性取值,c(j)表示第j条签到数据中兴趣点所属的类标;n表示用户签到数据集D中签到数据的总个数,δ(x,y)为二值函数,
4.如权利要求1所述的一种细粒度属性加权方法,其特征在于:步骤S104中,将所述初始值矩阵作为随机重启游走中的初始状态矩阵Q1,利用初始状态矩阵计算得到转移矩阵B;根据初始状态矩阵Q1和转移矩阵B,结合重启概率p和随机游走概率1-p增量式的更新当前状态矩阵Q2n-1;其中,2n-1表示当前游走步数;当两个连续的状态矩阵中的最大的元素的差值ε小于阈值θ时,停止随机重启游走,并将当前的状态矩阵作为细粒度属性权值的最优值矩阵Q;其中,所述的随机重启游算法的重启因子p、随机游走因子1-p、阈值θ均为超参数,预先人为设定。
5.如权利要求4所述的一种细粒度属性加权方法,其特征在于:所述初始状态矩阵如公式(2)所示:
上式中,wk,u表示第u个属性值,第k个类标对应的细粒度属性权值;u=1,2,...,U,U是所有属性的所有取值的总个数;k=1,2,…,t,t为类标总个数;
所述转移矩阵B由所述初始状态矩阵与其转置相乘获得,具体如公式(3)所示:
上式中,初始状态矩阵与初始状态矩阵的转置相乘的前后顺序由类标总个数t和所有属性的所有属性取值的总个数U的大小决定;
增量式的更新当前状态矩阵Q2n-1;具体更新公式如公式(4)所示:
所述细粒度属性权值的最优值矩阵Q,在当两个连续的细粒度属性权值矩阵的差值ε小于阈值θ时获得,具体如公式(5)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010889448.9/1.html,转载请声明来源钻瓜专利网。