[发明专利]一种行业分类模型训练方法、分类方法与装置在审
申请号: | 202010664798.5 | 申请日: | 2020-07-10 |
公开(公告)号: | CN113918709A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 孙一丹;张清华;陈萍;卢翠兰 | 申请(专利权)人: | 银联数据服务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06N20/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 侯林林 |
地址: | 201201 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例涉及大数据处理领域,尤其涉及一种行业分类模型训练方法、分类方法与装置,方法包括:客户端构建领域词词库,领域词词库由领域词的文本和对应的所属领域组成。客户端根据领域词词库,对包括企业名称和标签类别的训练文本集合处理,包括对企业名称进行分词和语义增强,得到企业名称的词向量特征,其中企业名称的词向量特征由企业名称分词之后的各个词向量加权组合得到的。最终,客户端根据企业名称的词向量特征和标签类别,对用于行业分类的分类器进行训练,得到有监督的机器学习多分类模型,该模型可以实现基于企业简称完成该企业的行业分类,既保证了企业分类的准确性,又能够提高处理效率。 | ||
搜索关键词: | 一种 行业 分类 模型 训练 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银联数据服务有限公司,未经银联数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010664798.5/,转载请声明来源钻瓜专利网。
- 上一篇:燃气-空气联合循环分布式能源系统
- 下一篇:取代苯丙咪唑类衍生物及其应用