[发明专利]企业名称智能分类的方法及系统在审
申请号: | 201910934947.2 | 申请日: | 2019-09-29 |
公开(公告)号: | CN111209365A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 王珂;陈菲琪;张昕然;王景斌 | 申请(专利权)人: | 江苏苏宁银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06Q40/02 |
代理公司: | 南京先科专利代理事务所(普通合伙) 32285 | 代理人: | 缪友菊 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 企业名称 智能 分类 方法 系统 | ||
1.一种企业名称智能分类的方法,其特征在于,包括:
对企业名称文本数据进行人工标注,得到原始数据集;
对所述原始数据集进行数据预处理;
使用TF-IDF模型对预处理后的所述原始数据集进行特征提取,使用one-hot编码和word2vec模型将提取的特征转为词向量;
将所述词向量分别投入到Capsule模型、TextCNN模型和LightGBM模型进行训练和测试,测试结果达到预设精度的则停止训练并保存相应模型,否则重新进行训练和测试;
载入训练完成的Capsule模型、TextCNN模型和LightGBM模型并投入所述词向量进行预测,分别得到第一预测结果、第二预测结果和第三预测结果;
采用智能投票机制对所述第一预测结果、第二预测结果和第三预测结果进行投票决策,得到最终预测结果;
将所述最终预测结果返回至前台服务端,与用户进行交互。
2.如权利要求1所述的企业名称智能分类的方法,其特征在于,所述数据预处理包括句子长度填充、分词、去停用词和名词代换。
3.如权利要求1所述的企业名称智能分类的方法,其特征在于,所述智能投票机制包括最差机制和少数服从多数机制,所述最差机制为:当第一预测结果、第二预测结果和第三预测结果中出现最低评级时,则所述最终预测结果直接为最低评级;
所述少数服从多数机制为:当第一预测结果、第二预测结果和第三预测结果都不是最低评级时,根据所述少数服从多数机制投票选出所述最终预测结果。
4.一种企业名称智能分类的系统,其特征在于,包括:
标注模块,对企业名称文本数据进行人工标注,得到原始数据集;
文本分类模块,包括:
预处理单元,对所述原始数据集进行数据预处理;
特征提取单元,使用TF-IDF模型对预处理后的所述原始数据集进行特征提取,使用one-hot编码和word2vec模型将提取的特征转为词向量;
模型训练单元,将所述词向量分别投入到Capsule模型、TextCNN模型和LightGBM模型进行训练和测试,测试结果达到预设精度的则停止训练并保存相应模型,否则重新进行训练和测试;
预测单元,载入训练完成的Capsule模型、TextCNN模型和LightGBM模型并投入所述词向量进行预测,分别得到第一预测结果、第二预测结果和第三预测结果;
智能投票调度模块,采用智能投票机制对所述第一预测结果、第二预测结果和第三预测结果进行投票决策,得到最终预测结果;
HTTP数据交换模块,将所述最终预测结果传送给前台服务端;
前台服务端,与用户进行交互。
5.如权利要求4所述的企业名称智能分类的系统,其特征在于,所述预处理单元包括句子长度填充单元、分词单元、去停用词单元和名词代换单元。
6.如权利要求4所述的企业名称智能分类的系统,其特征在于,所述智能投票调度模块包括:
最差机制单元,当第一预测结果、第二预测结果和第三预测结果中出现最低评级时,则所述最差机制单元直接给出最低评级的所述最终预测结果;
投票单元,当第一预测结果、第二预测结果和第三预测结果都不是最低评级时,所述投票单元根据少数服从多数机制投票选出所述最终预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏苏宁银行股份有限公司,未经江苏苏宁银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910934947.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:声波谐振器
- 下一篇:一种冷冻干燥系统及方法