[发明专利]一种信息归类方法及系统有效
申请号: | 202310930285.8 | 申请日: | 2023-07-27 |
公开(公告)号: | CN116644339B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 邱发科;钱秋雷;姜金龙;高跃岭;李明旭;王义同 | 申请(专利权)人: | 山东唐和智能科技有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F40/205;G06F40/284;G06F40/289;G06V10/764;G06V30/18;G06V30/19 |
代理公司: | 山东道智永盛知识产权代理事务所(普通合伙) 37407 | 代理人: | 张东立 |
地址: | 261000 山东省潍坊市高新区新城街*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 归类 方法 系统 | ||
本发明涉及信息归类的方法及系统,尤其涉及信息处理技术领域,包括:信息采集模块,用以对推送信息进行采集;分析模块,用以对推送信息中的推送文字和推送图像进行分析,以得到文字特征向量和文字分类影响率;推送分类模块,用以根据文字特征向量计算推送信息的文字分类权重,还用以根据计算的文字分类权重对推送信息的推送分类进行判断,还用以根据文字分类影响率对文字分类权重进行调整;用户交互模块,用以获取用户对推送分类的反馈结果;优化模块,用以对文字分类权重的计算结果进行优化,还用以对推送信息的文字特征向量进行优化。本发明实现了对推送信息的分类,提高了推送信息分类效率和准确度。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息归类方法及系统。
背景技术
在信息时代的飞速发展下,人们可以通过互联网获取到各种各样的信息,各种推送信息的内容也越来越复杂,经常出现推送信息的分类不与内容相符,或者根本没有对推送信息的分类的情况,造成了用户无法准确的获取到自己想要的推送信息。本发明依据上述问题,根据对推送信息的内容识别,设计分类算法,来实现对推送信息的准确分类,保证用户获取到自己需要的分类的推送信息。
中国专利公开号:CN109947932A公开了一种推送信息分类方法及系统,用于提高推送信息分类的效率和准确性,该方法包括获取推送信息对应的文本信息;将所述文本信息进行分词处理,获得所述文本信息对应的词组序列;对所述词组序列中的每个词组进行向量编码后,输入到深度神经网络模型;根据所述深度神经网络模型的输出结果,确定所述推送信息为垃圾信息,并确定所述推送信息在垃圾信息中的类型。该发明仅实现了对推送信息是否为垃圾信息的分类,未能实现对推送信息的准确分类。本发明通过对推送信息中的推送文字和推送图像进行分析,设计分类算法从而实现了对推送信息的准确分类,解决了现有技术中存在推送分类效率低,不准确的问题。
发明内容
为此,本发明提供一种信息归类方法及系统,用以克服现有技术中推送分类效率低,不准确的问题。
为实现上述目的,本发明提供一种信息归类系统,包括:
信息采集模块,用以对推送信息进行采集;
分析模块,用以对推送信息中的推送文字和推送图像进行分析,以得到文字特征向量和文字分类影响率;所述分析模块设有文字预处理单元,用以对推送信息中的推送文字进行断句、去词和断词预处理,以得到推送文字中的分析词组;所述分析模块还设有关键词分析单元,用以对所述分析词组进行关键词分析,以得到推送文字在各预设分类下的文字特征向量;所述分析模块还设有图像预处理单元,用以根据图像灰度值对推送信息中的推送图像进行分区预处理;所述分析模块还设有特征分析单元,用以对预处理后的推送图像进行特征分析,以得到图像特征向量,并以此设置文字分类影响率;
推送分类模块,用以根据文字特征向量计算推送信息的文字分类权重,推送分类模块还用以根据计算的文字分类权重对推送信息的推送分类进行判断,推送分类模块还用以根据文字分类影响率对文字分类权重进行调整;
用户交互模块,用以获取用户对推送分类的反馈结果;
优化模块,用以在用户反馈结果为简单反馈时,对文字分类权重的计算结果进行优化,还用以在用户反馈结果为复杂反馈时,对推送信息的文字特征向量进行优化;所述优化模块设有分析优化单元,用以根据所述复杂反馈对推送文字的分析方法进行优化;所述优化模块还设有分类优化单元,用以根据简单反馈对文字分类权重的计算结果进行优化。
进一步地,所述文字预处理单元在对推送信息中的推送文字进行断句预处理时,根据推送文字中的标点符号对推送文字进行断句预处理,以获得多组长句;
所述文字预处理单元在对各组长句进行去词预处理时,根据无用关键词对各组长句进行去词预处理,去除各组长句中与无用关键词相同的文字,以形成多组短句;
所述文字预处理单元在对各组短句进行断词预处理时,设置断词间隔k,k∈N+且k≥2,从第j个文字开始进行断词预处理,其中j的取值范围为1≤j≤k-1,以获得多组分析词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东唐和智能科技有限公司,未经山东唐和智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310930285.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置