[发明专利]货源信息分类方法、装置、电子设备、存储介质有效
申请号: | 202011473251.3 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112418354B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 郁博文;张鹏 | 申请(专利权)人: | 江苏满运物流信息有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F40/284 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
地址: | 210012 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 货源 信息 分类 方法 装置 电子设备 存储 介质 | ||
1.一种货源信息分类方法,其特征在于,包括:
基于规则匹配判断待分类货源信息是否为准有效信息;
若是,则提取所述待分类货源信息的特征获得特征向量;
将所述特征向量分别输入至少两个基学习器,所述至少两个基学习器包括一个快速文本分类器和一个文本卷积神经网络分类器,所述快速文本分类器包括依次相连的第一输入层、隐藏层以及第一输出层,所述快速文本分类器的第一输入层包括由所述特征向量划分获得的N个字节片段序列,N为大于1的整数,所述隐藏层通过分层Softmax以获得所述第一输出层的输出,所述文本卷积神经网络分类器包括依次相连的第二输入层、卷积层、池化层以及第二输出层;
将所述至少两个基学习器的输出输入至一次学习器;以及
根据所述次学习器的输出,判断所述待分类货源信息是否为有效信息,包括:根据所述次学习器的输出,判断所述待分类货源信息是否为广告信息和/或抱怨信息。
2.如权利要求1所述的货源信息分类方法,其特征在于,所述基于规则匹配判断待分类货源信息是否为准有效信息包括:
判断所述待分类货源信息中是否存在与关键词集中字符一致和/或拼音一致的字段,所述关键词集中包括多个预设定的禁用词;
若是,则判断所述待分类货源信息为无效信息;
若否,则判断所述待分类货源信息为准有效信息。
3.如权利要求1所述的货源信息分类方法,其特征在于,所述基于规则匹配判断待分类货源信息是否为准有效信息包括:
判断所述待分类货源信息中是命中无效信息规则集合中的规则,所述无效信息规则集合中包括多个预设定的无效信息规则;
若是,则判断所述待分类货源信息为无效信息;
若否,则判断所述待分类货源信息为准有效信息。
4.如权利要求1所述的货源信息分类方法,其特征在于,所述提取所述待分类货源信息的特征获得特征向量包括:
提取所述待分类货源信息的直接特征;
提取所述待分类货源信息的拼音特征;
提取所述待分类货源信息的字段特征;
拼接所述待分类货源信息的直接特征、拼音特征以及字段特征,以形成所述待分类货源信息的特征向量。
5.一种货源信息分类装置,其特征在于,包括:
规则匹配模块,配置成基于规则匹配判断待分类货源信息是否为准有效信息;
提取模块,配置成当所述规则匹配模块判断为是时,提取所述待分类货源信息的特征获得特征向量;
第一输入模块,配置成将所述特征向量分别输入至少两个基学习器,所述至少两个基学习器包括一个快速文本分类器和一个文本卷积神经网络分类器,所述快速文本分类器包括依次相连的第一输入层、隐藏层以及第一输出层,所述快速文本分类器的第一输入层包括由所述特征向量划分获得的N个字节片段序列,N为大于1的整数,所述隐藏层通过分层Softmax以获得所述第一输出层的输出,所述文本卷积神经网络分类器包括依次相连的第二输入层、卷积层、池化层以及第二输出层;
第二输入模块,配置成将所述至少两个基学习器的输出输入至一次学习器;以及
判断模块,配置成根据所述次学习器的输出,判断所述待分类货源信息是否为有效信息,包括:根据所述次学习器的输出,判断所述待分类货源信息是否为广告信息和/或抱怨信息。
6.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至4任一项所述的货源信息分类方法。
7.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至4任一项所述的货源信息分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏满运物流信息有限公司,未经江苏满运物流信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011473251.3/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置