[发明专利]一种面向纸包装及其相关行业的企业多元标签标识方法在审
申请号: | 201911335749.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111191001A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 陈家银;龚小龙;陈曦;麻志毅;彭军民 | 申请(专利权)人: | 浙江大胜达包装股份有限公司;浙江省北大信息技术高等研究院;杭州未名信科科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州融方专利代理事务所(普通合伙) 33266 | 代理人: | 沈相权 |
地址: | 311201 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 纸包装 及其 相关 行业 企业 多元 标签 标识 方法 | ||
本发明涉及一种企业多元标签标识方法,尤其涉及一种面向纸包装及其相关行业的企业多元标签标识方法。提出一种层次迭代识别框架,可基于少量标注数据衍生模型构造所需要的大数据集,最后应用轻量级的XML‑CNN深度模型方法,提升总体标签识别效率,本发明旨在先构建适合纸包装行业的多元标签体系,随后提出有效的多元标签识别方法,从而解决该行业及其相关行业的企业精准分类需求,提高企业复杂信息的检索效率。一种面向纸包装及其相关行业的企业多元标签标识方法,提高企业复杂信息的检索效率。
技术领域
本发明涉及一种企业多元标签标识方法,尤其涉及一种面向纸包装及其相关行业的企业多元标签标识方法。
背景技术
企业多元标签是指一个企业实体包含多个属性标签,一个标签是对企业某些维度信息的高度抽象概括。尽管企业多元标签可应用于企业精准分类、复杂信息检索、有效标签推荐等众多领域[1,2],但目前应用状况并不成熟,其主要原因有以下两点:一,现有多元标签体系单一,难以满足垂直领域的个性化行业需求;二,多元标签识别技术需要大量的标注数据。
当前企业多元标签体系主要聚焦在行业类别,主营产品等维度上,比如“食品制造”、“文化娱乐”、“奶茶”等。而在纸包装行业中,企业更加关注的是物流运输距离、企业营销关系、企业纸包装需求量等深层次维度信息,现有的企业多元标签体系无法满足该行业中的深层次需求。因此本发明提出如下思路,在物流运输距离维度上,设计“同区”,“同市”,“同省”等概念标签,而在企业营销关系上设计出“客户”、“同行”、“供应商”等概念标签。该标签体系不仅方便纸包装行业的市场营销人员快速地了解目标企业与自身企业之间的距离,同时了解目标企业与自身企业可能存在的关系。
而在企业多元标签识别任务中,由于深度学习方法需要大量的标注数据,而实际应用中有企业多元标签的标注数据极度匮乏,手动标注数据需要消耗人力,且带来大量人工成本。基于此,本发明首先采用一种多个传统模型迭代识别并进行对比的方法,生成大量的高质量标记数据,降低人工标注成本。而后应用轻量级的XML-CNN深度模型方法,提升总体标签识别效率。本发明将上述两步有效结合,提出了一种基于深度学习的层次迭代识别框架。
与本发明相似的专利“一种企业行业多标签分类方法”(CN109783818A) [3],该发明使用双层的循环神经网络来识别企业的行业类别标签,并没有面向特定行业的个性化需求进行深层次标签识别。此外,相对其他深度模型来说,双层循环神经网络模型较为复杂,运行部署效率低。针对该问题,本发明应用一种轻量级的XML-CNN深度模型[4]进行企业多元标签的识别,该方法在卷积神经网络(CNN)基础上,使用动态池化(Dynamic Max Pooling)和瓶颈式隐藏层 (Hidden Bottleneck Layer)策略,整体识别效果优于其他深度模型。
发明内容
本发明主要是解决现有技术中存在的不足,解决一种深度学习需要的大量标注数据在实际应用场景中常常难以满足,针对此问题,本发明提出一种层次迭代识别框架,可基于少量标注数据衍生模型构造所需要的大数据集,最后应用轻量级的XML-CNN深度模型方法,提升总体标签识别效率,本发明旨在先构建适合纸包装行业的多元标签体系,随后提出有效的多元标签识别方法,从而解决该行业及其相关行业的企业精准分类需求,提高企业复杂信息的检索效率的一种面向纸包装及其相关行业的企业多元标签标识方法。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种面向纸包装及其相关行业的企业多元标签标识方法,按以下步骤进行:
(一)、多元标签体系构建:
企业多元标签是指利用那些没有直接商业价值的企业数据,通过清洗、整理、挖掘,并抽象出能直接满足业务需求的信息,然后以多个标签的形式展示出来,支持企业精准分类、高效复杂查询相关需求;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大胜达包装股份有限公司;浙江省北大信息技术高等研究院;杭州未名信科科技有限公司,未经浙江大胜达包装股份有限公司;浙江省北大信息技术高等研究院;杭州未名信科科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911335749.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面资源的更新方法、装置、计算机设备和存储介质
- 下一篇:一种药品审计方法