[发明专利]一种推送信息分类方法及系统有效
申请号: | 201711056833.X | 申请日: | 2017-10-27 |
公开(公告)号: | CN109947932B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 蒋忠强;梁俊;全兵;杨静;李婧;桑永胜;严明 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06F40/30;G06N3/04;H04W4/14 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 215163 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 推送 信息 分类 方法 系统 | ||
1.一种推送信息分类方法,其特征在于,该方法包括:
获取推送信息对应的文本信息;
将所述文本信息进行分词处理,获得所述文本信息对应的词组序列;
根据所述词组序列中的每个词组与其他词组之间的相关性对所述词组序列中的每个词组进行向量编码;
将向量编码之后的词组序列输入到深度神经网络模型;其中,所述深度神经网络模型包括回复式双向LSTM层和前向Softmax层,所述回复式双向LSTM层用于解析所述每个词组的多层含义,更新所述每个词组对应的所述向量编码,所述前向Softmax层根据所述更新后的所述向量编码对所述每个词组进行分类,并将所述分类中词组数量最多的分类作为所述深度神经网络模型的输出结果;
根据所述深度神经网络模型的输出结果,确定所述推送信息为垃圾信息,并确定所述推送信息在垃圾信息中的类型。
2.如权利要求1所述的方法,其特征在于,所述回复式双向LSTM层更新所述每个词组对应的所述向量编码后,该方法还包括:
获取垃圾信息的样本数据;
对所述样本数据进行语义分析确定每个样本数据所表达的语义,并基于所述语义的共性确定垃圾信息模型中垃圾信息所对应的多种类型;
所述前向Softmax层根据所述更新后的所述向量编码和所述垃圾信息模型确定所述每个词组对应的类型,并将词组数量最多的类型确定为所述推送信息的类型,然后将所述确定的所述推送信息的类型作为所述深度神经网络模型的输出结果。
3.如权利要求1所述的方法,其特征在于,所述深度神经网络模型还包括Highway层,该方法还包括:
所述更新后的所述向量编码经过所述Highway层后输入所述前向Softmax层;其中,所述Highway层用于放大所述每个词组对应的语义特征值。
4.如权利要求1所述的方法,其特征在于,将所述文本信息进行分词处理前,该方法还包括:
将所述文本信息中的繁体中文转化为简体中文;
去除所述文本信息中的错别字和乱码。
5.如权利要求1所述的方法,其特征在于,对所述词组序列中的每个词组进行向量编码后,输入到深度神经网络模型之后,该方法还包括:
判断所述深度神经网络模型中是否存在所述输入所述深度神经网络的词组;
如果存在,则不保存所述输入所述深度神经网络的词组;
如果不存在,则将所述输入所述深度神经网络的词组以及所述词组对应的含义保存到所述深度神经网络模型中。
6.一种推送信息分类系统,其特征在于,该系统包括:
获取模块,用于获取推送信息对应的文本信息;
处理模块,用于将所述文本信息进行分词处理,获得所述文本信息对应的词组序列;
根据所述词组序列中的每个词组与其他词组之间的相关性对所述词组序列中的每个词组进行向量编码;
将向量编码之后的词组序列输入到深度神经网络模型;其中,所述深度神经网络模型包括回复式双向LSTM层和前向Softmax层,所述回复式双向LSTM层用于解析所述每个词组的多层含义,更新所述每个词组对应的所述向量编码,所述前向Softmax层根据所述更新后的所述向量编码对所述每个词组进行分类,并将所述分类中词组数量最多的分类作为所述深度神经网络模型的输出结果;
输出模块,用于根据所述深度神经网络模型的输出结果,确定所述推送信息为垃圾信息,并确定所述推送信息在垃圾信息中的类型。
7.如权利要求6所述的系统,其特征在于,该系统还包括:
学习模块,用于获取垃圾信息的样本数据;
对所述样本数据进行语义分析确定每个样本数据所表达的语义,并基于所述语义的共性确定垃圾信息模型中垃圾信息所对应的多种类型;
所述处理模块还用于:
使所述前向Softmax层根据所述更新后的所述向量编码和所述垃圾信息模型确定所述每个词组对应的类型,并将词组数量最多的类型确定为所述推送信息的类型,然后将所述确定的所述推送信息的类型作为所述深度神经网络模型的输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团公司,未经中移(苏州)软件技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711056833.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置