[发明专利]一种政府采购品目层次分类模型的构建方法在审
申请号: | 202111130390.0 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113946678A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 谭军;潘嵘;李迪欣;王君瑶;杜建伟;钟鸣 | 申请(专利权)人: | 广州市伟时信息系统技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F16/33;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510260 广东省广州市海珠区新港西路135号大院*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 政府 采购 品目 层次 分类 模型 构建 方法 | ||
本发明提供一种政府采购品目层次分类模型的构建方法,该方法首先为采购品目构建层级结构并进行编码,然后对采购项目名称进行文本清洗和分词,使用连续词袋模型模型训练语料获得词向量或者使用Bert中文预训练模型直接获取词向量,得到初始的文本表示。最后将文本表示和标签表示带入模型进行训练。HA‑BiGRU模型中包含的三层网络能够有效的解决上述问题。以BiGRU网络为编码器的文本编码层能够进一步提取上下文的语义信息,层次注意力循环网络层能够对层次之间的依赖关系进行建模,并且通过文本‑标签注意力模块来增强文本与标签之间的关联,混合预测层综合了层次标签的局部损失和全局损失,通过减小总损失来优化模型。
技术领域
本发明涉及具有标签层级结构的文本分类方法领域,更具体地,涉及一种政府采购品目层次分类模型的构建方法。
背景技术
随着信息化时代的来临,蓬勃发展的招投标行业迎来了全新的机遇和挑战。政府采购包括货物、工程和服务,采购人主体是各级国家机关、事业单位和团体组织。政府采购中,采购品目是一个非常有效的研究变量,它能从不同的维度和层面刻画各个类目的采购情况、项目预算和资金等情况,为采买决策提供一定的有效信息。同时采购品目种类繁多,不易区分,如果通过采购项目信息对合适的类目进行关联,则会为按层级检索带来便利。对采购品目进行层级管理,可以为采买负责人员节约大量的时间和精力,优化办公流程。因此,通过主流的自然语言处理技术,使用采购项目中的文本信息来预测对应的采购品目具有重大意义。它不仅能够填补品目信息,为后续的统计分析提供完整数据,还能简化政府采购人员的办公流程、提高办公效率。
在多标签分类问题中,将多标签分类问题转化为多个单标签二分类问题是常见的方法,但是当标签种类过多时会导致模型效果降低。所以对于多标签分类而言,主要有两种方式表示标签之间的关系。一种是将多标签展平,即全局化,所有标签都属于同一层级。一种是建立层次标签,即局部化,标签自顶向下存在层级关系。在大部分情况下,把标签展平是常用的方法,例如决策树和朴素贝叶斯方法,直接对最后一层标签进行预测。然而在数据量较大的情况下,将层次标签展平后会使得类别数目剧增,增加稀疏性,导致预测效果不佳。所以,充分利用文本的语义关系和标签之间的层级结构以及标签和文本的相关性是目前本领域技术人员需要解决的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市伟时信息系统技术有限公司,未经广州市伟时信息系统技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130390.0/2.html,转载请声明来源钻瓜专利网。