[发明专利]市场主体行业确定模型训练方法、装置、设备及程序产品在审
申请号: | 202210513994.1 | 申请日: | 2022-05-11 |
公开(公告)号: | CN114881151A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 张跃伟;袁宇航;韩宇 | 申请(专利权)人: | 阿里云计算有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q10/06 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 刘真 |
地址: | 310024 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 市场主体 行业 确定 模型 训练 方法 装置 设备 程序 产品 | ||
本公开实施例公开了一种市场主体行业确定模型训练方法、装置、设备及程序产品,所述市场主体行业确定模型训练方法包括:确定初始市场主体行业确定模型;获取训练市场主体行业确定输入数据和与所述训练市场主体行业确定输入数据对应的训练市场主体行业确定结果数据;以所述训练市场主体行业确定输入数据作为输入,以与其对应的训练市场主体行业确定结果数据作为输出训练所述初始市场主体行业确定模型,得到目标市场主体行业确定模型。该技术方案能够基于市场主体经营范围,自动识别该市场主体对应的一个或多个行业,保证了行业自动识别的准确性和全面性,为后续行业政策的匹配提供了有效的数据支持。
技术领域
本公开涉及市场主体数据处理技术领域,具体涉及一种市场主体行业确定模型训练方法、装置、设备及程序产品。
背景技术
随着社会的发展和进步,企业的数量越来越多,针对各行各业企业的政策也层出不穷,为了使企业能够及时、全面、准确地获取与其对应的政策,保障企业的自身利益,亟需一种能够根据企业注册信息自动识别其所在行业的方案,但由于企业在注册登记时,通常只能填写一个行业门类,并且有些企业填写的行业门类并不准确,这就为基于企业注册信息的行业自动识别以及后续的政策匹配带来了困难,比如一个工业生产的企业,因为注册登记时仅登记了零售批发行业,因此后续就无法匹配到制造业的政策。
发明内容
本公开实施例提供一种市场主体行业确定模型训练方法、装置、设备及程序产品。
第一方面,本公开实施例中提供了一种市场主体行业确定模型训练方法。
具体的,所述市场主体行业确定模型训练方法,包括:
确定初始市场主体行业确定模型;
获取训练市场主体行业确定数据集合,其中,所述训练市场主体行业确定数据集合包括训练市场主体行业确定输入数据和与所述训练市场主体行业确定输入数据对应的训练市场主体行业确定结果数据,所述训练市场主体行业确定输入数据是基于所述训练市场主体的市场主体经营范围生成的;
以所述训练市场主体行业确定输入数据作为输入,以与其对应的训练市场主体行业确定结果数据作为输出训练所述初始市场主体行业确定模型,得到目标市场主体行业确定模型。
在本公开一种实现方式中,其中,所述市场主体行业确定模型为基于相似性进行市场主体行业分类的模型。
在本公开一种实现方式中,获取训练市场主体行业确定输入数据,包括:
获取训练市场主体经营范围项目和预设经营范围项目的联合嵌入式向量,作为第一嵌入式向量;
获取训练市场主体的名称和注册行业对应的第二嵌入式向量;
合并所述第一嵌入式向量和第二嵌入式向量,得到所述训练市场主体行业确定输入数据。
在本公开一种实现方式中,所述获取训练市场主体经营范围项目和预设经营范围项目的联合嵌入式向量,作为第一嵌入式向量,包括:
获取训练市场主体经营范围项目的第一语句表达和预设经营范围项目的第二语句表达;
将所述第一语句表达和第二语句表达输入至第一预设编码模型中,得到所述训练市场主体经营范围项目和预设经营范围项目的联合嵌入式向量,将其作为第一嵌入式向量,其中,所述第一预设编码模型为基于基础编码模型附加多行业分类任务后训练得到的编码模型。
在本公开一种实现方式中,所述获取训练市场主体经营范围项目的第一语句表达之前,还包括:
获取训练市场主体经营范围;
对于所述训练市场主体经营范围进行噪声清洗;
基于经过噪声清洗后的训练市场主体经营范围,提取得到训练市场主体经营范围项目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210513994.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种薄膜电容器
- 下一篇:具有防溢胶机构的夹胶玻璃用智能加工设备