[发明专利]一种面向公共资源招投标公告数据的自动分类方法及其系统在审
申请号: | 201910715867.8 | 申请日: | 2019-08-05 |
公开(公告)号: | CN110472053A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 刘全超;祝华令;付永晖 | 申请(专利权)人: | 广联达科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08;G06Q30/08 |
代理公司: | 11390 北京和信华成知识产权代理事务所(普通合伙) | 代理人: | 胡剑辉<国际申请>=<国际公布>=<进入 |
地址: | 100193 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向公共资源招投标公告数据的自动分类方法及其系统,该自动分类方法包括学习过程以及测试过程或称生产过程,该学习过程包括:基于领域词典,采用LDA结合PMI技术对招投标数据进行自动标注,获得招投标标注数据;将获得招投标标注数据输入字符级别的CNN网络,获得多分类器模型;将获得的多分类器模型保存到文件中,获得多分类器模型文件。测试过程或生产过程包括:将用于测试或待分类的招投标数据输入到通过调用多分类器模型文件所得到的多分类器模型中;输出该用于测试或待分类的招投标数据的分类结果。该自动分类方法及其系统能够针对海量招投标公告内容本身进行数据挖掘,经智能分类提取出及时、精准的项目信息。 | ||
搜索关键词: | 多分类器 自动分类 测试过程 模型文件 生产过程 学习过程 标注 测试 分类结果 公告内容 公告数据 公共资源 模型保存 数据挖掘 项目信息 智能分类 自动标注 字符级别 分类 调用 输出 网络 | ||
【主权项】:
1.一种面向公共资源招投标公告数据的自动分类方法,包括学习过程以及测试过程和/或生产过程,其特征在于:/n所述学习过程包括:/n步骤110,基于领域词典,采用LDA结合PMI技术对招投标数据进行自动标注,获得招投标标注数据;其中,LDA为文档主题生成模型,PMI为点间互信息技术;/n步骤120,将获得招投标标注数据输入字符级别的CNN网络,训练获得多分类器模型;/n步骤130,将获得的多分类器模型保存到文件中,获得多分类器模型文件;/n其中,所述测试过程包括:/n步骤210,将用于测试的招投标数据输入到通过调用多分类器模型文件所得到的多分类器模型中;/n步骤220,多分类器模型输出该用于测试的招投标数据的分类结果;/n其中,所述生产过程包括:/n步骤310,将待分类的招投标数据输入到通过调用多分类器模型文件所得到的多分类器模型中;/n步骤320,多分类器模型输出该待分类的招投标数据的分类结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广联达科技股份有限公司,未经广联达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910715867.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的中文社交平台情感分析方法
- 下一篇:一种数据处理方法和装置