[发明专利]基于语义匹配的产业链挂载企业的方法、装置及相关组件在审

专利信息
申请号: 202211711396.1 申请日: 2022-12-29
公开(公告)号: CN115860005A 公开(公告)日: 2023-03-28
发明(设计)人: 蔡青山 申请(专利权)人: 企知道网络技术有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/205;G06F16/35;G06F18/22
代理公司: 成都维企专利代理有限公司 51345 代理人: 汪任飞
地址: 518000 广东省深圳市南山区西丽*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 匹配 产业链 企业 方法 装置 相关 组件
【说明书】:

发明公开了一种基于语义匹配的产业链挂载企业的方法、装置及相关组件,涉及数据处理领域。该方法包括获取产业链节点词和目标企业的主营词,并将企业主营词和产业链节点词进行特征向量转换,得到对应的特征向量;将转化后的所有特征向量分别输入至预训练后的产业链主题语义模型,得到主营词义向量和节点语义向量;基于预设的主营词分数引擎,获取企业主营词的分数;计算当前主营词义向量和各节点语义向量之间的相似度,并将分数和相似度进行加权计算,得到相似分数;在相似分数达到相似分数阈值后,将目标企业和产业链节点词对应的产业链节点建立挂载关系。该方法使得企业可以精准挂靠在对应的产业链上,有效提高挂载精确度和召回率。

技术领域

本发明涉及数据处理领域,尤其涉及一种基于语义匹配的产业链挂载企业的方法、装置及相关组件。

背景技术

目前为了方便将企业和产业链建立挂载关系,通常会通过人工的方式采集企业的经营信息,然后基于企业的经营信息对该企业进行产业链判断,例如通过网站例如百度采集到A企业的运营信息主要是B物品,则直接在产业链上寻找包含B物品的产业链,然后将该产业链和A企业匹配到一起。

对此,发明人认为,通过人工的方式进行企业和产业链的挂载,依赖于人员经验,故存在较大的误差,使得企业和产业链的挂载存在精确度较低的问题。

发明内容

本发明的目的是提供一种基于语义匹配的产业链挂载企业的方法、装置及相关组件,旨在解决现有将企业和产业链建立挂载的方式存在精确度较低的问题。

为解决上述技术问题,本发明的目的是通过以下技术方案实现的:提供一种基于语义匹配的产业链挂载企业的方法,其包括:

获取预处理后的所有的产业链节点词和目标企业的主营词,并将所述企业主营词和所述产业链节点词进行特征向量转换,得到对应的特征向量;

将转化后的所有所述特征向量分别输入至预训练后的产业链主题语义模型,得到与所述企业主营词对应的主营词义向量和与所述产业链节点词对应的节点语义向量;

基于预设的主营词分数引擎,获取所述企业主营词的分数;

计算当前所述主营词义向量和各所述节点语义向量之间的相似度,并将所述分数和所述相似度进行加权计算,得到相似分数;

在所述相似分数达到相似分数阈值后,将所述目标企业和所述产业链节点词对应的产业链节点建立挂载关系。

进一步的,所述基于预设的主营词分数引擎,获取所述企业主营词的分数,包括:

获取所述企业主营词的来源,并基于所述企业主营词的来源遍历预设的主营词分数引擎,获取得到所述企业主营词的来源所对应的企业主营词的分数。

进一步的,所述将所述目标企业和所述产业链节点词对应的产业链节点建立挂载关系之前,包括:

判断所述目标企业是否符合预设的业务逻辑规则;

若所述目标企业符合预设的业务逻辑规则,则将所述目标企业和对应的产业链节点建立挂载关系;

若所述目标企业不符合预设的业务逻辑规则,则将所述目标企业作为伪目标企业并过滤。

进一步的,所述相似度为余弦相似度。

进一步的,所述将转化后的所有所述特征向量分别输入至预训练后的产业链主题语义模型,得到与所述企业主营词对应的主营词义向量和与所述产业链节点词对应的节点语义向量,包括:

将转化后的所述特征向量输入至bert预训练模型,输出主营词义向量和节点语义向量。

进一步的,所述将转化后的所述特征向量输入至bert预训练模型之前,包括:

获取训练任务数据,将所述训练任务数据进行特征向量转换,得到对应的特征向量,所述训练任务数据包括产业链数据和企业数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于企知道网络技术有限公司,未经企知道网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211711396.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top