[发明专利]一种编码模型训练方法、装置、存储介质及电子设备有效
申请号: | 202010426286.5 | 申请日: | 2020-05-19 |
公开(公告)号: | CN111881928B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 陆韵;沈贝伦;李冰;江易;王鸿儒;赵尚上;王魁 | 申请(专利权)人: | 杭州中奥科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/26 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 310000 浙江省杭州市拱墅*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编码 模型 训练 方法 装置 存储 介质 电子设备 | ||
1.一种编码模型训练方法,其特征在于,所述方法包括:
数据元网络依据训练文件中的上下位关系生成至少1条游走路径,其中,所述训练文件为包含上下位关系的目录文件,所述游走路径包含至少两个节点和节点的游走顺序,所述节点为所述训练文件中的任意一个词汇;依据所述游走顺序构建距离矩阵,其中,所述距离矩阵包含任意一个节点到其他任意节点的距离;
依据节点总数量和平均度生成预估位数,其中,所述预估位数为每一个节点对应的编码预估的位数,所述平均度为每一个节点所连接的节点的平均数;
依据所述距离矩阵和哈希函数生成与每一个节点对应的编码,其中,所述编码的总位数等于所述预估位数;
依据每一个节点对应的编码的结果调整所述预估位数,作为最终的编码位数。
2.如权利要求1所述的编码模型训练方法,其特征在于,所述“依据所述游走顺序构建距离矩阵”的步骤,包括:
依据所述游走顺序获取每一条游走路径中的任意两个节点之间的期望距离;
依据任意两个节点之间的期望距离构建所述距离矩阵。
3.如权利要求2所述的编码模型训练方法,其特征在于,通过以下算式构建所述距离矩阵:
其中,Dx,y为距离矩阵中第x行、第y列元素的值,即节点x到节点y的距离;i为包含节点x,y的第i条游走路径;Ox,y为包含节点x,y的游走路径的数量;de(x,y)i为节点x、y在第i条游走路径中的期望距离。
4.如权利要求3所述的编码模型训练方法,其特征在于,所述“依据所述距离矩阵和哈希函数生成与每一个节点对应的编码”的步骤包括:
依据下列算式生成与每一个节点对应的编码:
其中,ψx,m为节点x的第m位编码;N为节点的总数量;hm为哈希函数集合H中的第m个哈希函数;ζ()为哈希符号函数。
5.如权利要求2所述的编码模型训练方法,其特征在于,依据以下算式获取游走路径中的任意两个节点之间的期望距离:
其中,节点x、y属于所述游走路径,de(x,y)为节点x、y在所述游走路径中的期望距离;c为同时包含节点x、y的子路径的个数;max_d为节点x、y之间所有路径中的最大距离;dx,yk为节点x、y在所述游走路径内的第k条路径上的距离;pc(x│y)为节点x、y在所述游走路径中同时出现的概率。
6.如权利要求1所述的编码模型训练方法,其特征在于,所述“依据每一个节点对应的编码的结果调整所述预估位数,作为最终的编码位数”的步骤包括:
判断每一个节点对应的编码是否发生冗余;
若未发生冗余,则将所述预估位数减少1位,作为新的预估位数,其中,所述冗余表征存在对应的编码相同的两个节点;
重复依据所述距离矩阵和哈希函数生成与每一个节点对应的编码,直至冗余,将所述预估位数增加1位,作为编码位数;
若发生冗余,则将所述预估位数增加1位,作为新的预估位数;
重复依据所述距离矩阵和哈希函数生成与每一个节点对应的编码,直至没有冗余,将新的预估位数作为编码位数。
7.一种编码模型训练装置,其特征在于,所述装置包括:
预处理单元,用于数据元网络依据训练文件中的上下位关系生成至少1条游走路径,其中,所述训练文件为包含上下位关系的目录文件,所述游走路径包含至少两个节点和节点的游走顺序,所述节点为所述训练文件中的任意一个词汇;还用于依据所述游走顺序构建距离矩阵,其中,所述距离矩阵包含任意一个节点到其他任意节点的距离:
编码单元,用于依据节点总数量和平均度生成预估位数,其中,所述预估位数为每一个节点对应的编码预估的位数,所述平均度为每一个节点所连接的节点的平均数;还用于依据所述距离矩阵和哈希函数生成与每一个节点对应的编码,其中,所述编码的总位数等于所述预估位数;还用于依据每一个节点对应的编码的结果调整所述预估位数,作为最终的编码位数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州中奥科技有限公司,未经杭州中奥科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010426286.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:笔录信息真假的判断方法、装置、存储介质及电子设备
- 下一篇:一种自发光控装置