[发明专利]一种基于义原的词语语义的预测方法及计算机设备在审
申请号: | 202110412919.1 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113486142A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 李涓子;刘宝巨;侯磊;吕鑫;肖镜辉 | 申请(专利权)人: | 华为技术有限公司;清华大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/9535;G06F40/30;G06K9/62;G06N3/04 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 词语 语义 预测 方法 计算机 设备 | ||
1.一种基于义原的词语语义的预测方法,其特征在于,包括:
获取第一词语在义原空间的第一向量,所述第一词语为已定义的词语,所述第一向量用于表征所述第一词语的语义,所述义原空间根据类别义原、扩展描述以及关联关系构建得到,所述关联关系用于表征所述类别义原与所述扩展描述之间的关系,所述第一向量包括第一子向量和第二子向量,所述第一子向量由第一类别义原确定,所述第二子向量由第一扩展描述以及第一关联关系确定,所述第二子向量经由模型学习得到,所述第一类别义原为所述第一词语对应的类别义原,所述第一扩展描述为所述第一类别义原的扩展描述,所述第一关联关系为所述第一类别义原与所述第一扩展描述之间的关联关系;
计算第二词语与所述第一词语之间的相关度,所述第二词语为未定义的词语;
根据所述第一向量与所述相关度,得到所述第二词语在所述义原空间的第二向量,所述第二向量用于表征所述第二词语的语义。
2.根据权利要求1所述的方法,其特征在于,所述获取第一词语在义原空间的第一向量包括:
在第一词语具备n种不同语义的情况下,获取所述n种语义在义原空间中对应的n个目标向量,一个目标向量用于表征所述第一词语的一种语义;
将所述n个目标向量融合,得到所述第一向量。
3.根据权利要求2所述的方法,其特征在于,所述将所述n个目标向量融合,得到所述第一向量包括:
对所述n个目标向量相加后求平均,得到所述第一向量。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述第一词语为m个,所述第一向量为m个,所述相关度为m个,一个第一词语对应一个第一向量,一个第一向量对应一个相关度,m≥2,所述根据所述第一向量与所述相关度,得到所述第二词语在所述义原空间的第二向量包括:
根据m个相关度的取值排序,计算每个第一词语的动态权重,所述动态权重与所述相关度呈正相关关系;
将每个第一向量、所述每个第一向量各自对应的相关度、所述每个第一向量的动态权重相乘,得到m个乘积结果;
将所述m个乘积结果相加,得到所述第二词语在所述义原空间的第二向量。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述计算第二词语与所述第一词语之间的相关度包括:
通过语言模型将所述第一词语以及所述第二词语投影为词向量空间中的第一点和第二点;
计算所述第一点与所述第二点之间的距离,所述距离用于表征所述第二词语与所述第一词语之间的相关度,所述距离与所述相关度呈反相关关系。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
通过语言模型将所述第一词语以及所述第二词语投影为词向量空间中经过空间原点的第一空间向量和第二空间向量;
计算所述第一空间向量与所述第二空间向量之间的夹角,所述夹角用于表征所述第二词语与所述第一词语之间的相关度,所述夹角与所述相关度呈反相关关系。
7.根据权利要求1-6中任一项所述的方法,其特征在于,
所述第一子向量为独热编码(one-hot)表示,所述第二子向量为稠密嵌入(denseembedding)表示。
8.根据权利要求1-7中任一项所述的方法,其特征在于,在得到所述第二词语在所述义原空间的第二向量之后,所述方法还包括:
根据所述第二向量以及点击情况构建用户画像,所述点击情况为目标用户账号通过终端设备点击包含所述第二词语的文章的情况;
获取候选文章的关键词在所述义原空间的第三向量;
计算所述第二向量与所述第三向量之间的相关度,并根据所述相关度确定所述候选文章与所述用户画像之间的匹配度;
在所述匹配度达到第一预设阈值的情况下,向所述目标用户账号当前登录的终端设备推荐所述候选文章。
9.根据权利要求8所述的方法,其特征在于,所述点击情况包括:
在预设时长内的总点击数,或,点击频率达到第二预设阈值的点击时间段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;清华大学,未经华为技术有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110412919.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光伏系统、直流汇流箱及接线错误检测方法
- 下一篇:触控操作方法及装置