[发明专利]基于语义匹配的产业链挂载企业的方法、装置及相关组件在审
申请号: | 202211711396.1 | 申请日: | 2022-12-29 |
公开(公告)号: | CN115860005A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 蔡青山 | 申请(专利权)人: | 企知道网络技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/205;G06F16/35;G06F18/22 |
代理公司: | 成都维企专利代理有限公司 51345 | 代理人: | 汪任飞 |
地址: | 518000 广东省深圳市南山区西丽*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 匹配 产业链 企业 方法 装置 相关 组件 | ||
1.一种基于语义匹配的产业链挂载企业的方法,其特征在于,包括:
获取预处理后的所有的产业链节点词和目标企业的主营词,并将所述企业主营词和所述产业链节点词进行特征向量转换,得到对应的特征向量;
将转化后的所有所述特征向量分别输入至预训练后的产业链主题语义模型,得到与所述企业主营词对应的主营词义向量和与所述产业链节点词对应的节点语义向量;
基于预设的主营词分数引擎,获取所述企业主营词的分数;
计算当前所述主营词义向量和各所述节点语义向量之间的相似度,并将所述分数和所述相似度进行加权计算,得到相似分数;
在所述相似分数达到相似分数阈值后,将所述目标企业和所述产业链节点词对应的产业链节点建立挂载关系。
2.根据权利要求1所述的基于语义匹配的产业链挂载企业的方法,其特征在于,所述基于预设的主营词分数引擎,获取所述企业主营词的分数,包括:
获取所述企业主营词的来源,并基于所述企业主营词的来源遍历预设的主营词分数引擎,获取得到所述企业主营词的来源所对应的企业主营词的分数。
3.根据权利要求1-2任一项所述的基于语义匹配的产业链挂载企业的方法,其特征在于,所述将所述目标企业和所述产业链节点词对应的产业链节点建立挂载关系之前,包括:
判断所述目标企业是否符合预设的业务逻辑规则;
若所述目标企业符合预设的业务逻辑规则,则将所述目标企业和对应的产业链节点建立挂载关系;
若所述目标企业不符合预设的业务逻辑规则,则将所述目标企业作为伪目标企业并过滤。
4.根据权利要求3所述的基于语义匹配的产业链挂载企业的方法,其特征在于,所述相似度为余弦相似度。
5.根据权利要求3所述的基于语义匹配的产业链挂载企业的方法,其特征在于,所述将转化后的所有所述特征向量分别输入至预训练后的产业链主题语义模型,得到与所述企业主营词对应的主营词义向量和与所述产业链节点词对应的节点语义向量,包括:
将转化后的所述特征向量输入至bert预训练模型,输出主营词义向量和节点语义向量。
6.根据权利要求5所述的基于语义匹配的产业链挂载企业的方法,其特征在于,所述将转化后的所述特征向量输入至bert预训练模型之前,包括:
获取训练任务数据,将所述训练任务数据进行特征向量转换,得到对应的特征向量,所述训练任务数据包括产业链数据和企业数据;
将转换后的所有特征向量输入至依次连接的12个Transformer层,并经过分类器输出分类结果,其中,各所述Transformer层包括多头注意力层、第一标准化层、前馈网络层、第二标准化层和2个残差连接层;
基于所述分类结果和产业链数据对所述bert预训练模型进行任务微调,并利用损失函数对所述bert预训练模型的超参数进行优化,得到优化后的bert预训练模型。
7.根据权利要求6所述的基于语义匹配的产业链挂载企业的方法,其特征在于,所述利用损失函数对所述bert预训练模型的超参数进行优化,包括:
利用对比损失函数对所述bert预训练模型的超参数进行优化。
8.一种基于语义匹配的产业链挂载企业的装置,其特征在于,包括:
特征向量转换单元,用于获取预处理后的所有的产业链节点词和目标企业的主营词,并将所述企业主营词和所述产业链节点词进行特征向量转换,得到对应的特征向量;
语义向量输出单元,用于将转化后的所有所述特征向量分别输入至预训练后的产业链主题语义模型,得到与所述企业主营词对应的主营词义向量和与所述产业链节点词对应的节点语义向量;
得分单元,用于基于预设的主营词分数引擎,获取所述企业主营词的分数;
相似分数获取单元,用于计算当前所述主营词义向量和各所述节点语义向量之间的相似度,并将所述分数和所述相似度进行加权计算,得到相似分数;
挂载单元,用于在所述相似分数达到相似分数阈值后,将所述目标企业和所述产业链节点词对应的产业链节点建立挂载关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于企知道网络技术有限公司,未经企知道网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211711396.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种船舶设备雷电防护等级评估方法
- 下一篇:一种显示面板