[发明专利]一种资讯分类处理的方法及系统在审

申请号：	202110762167.1	申请日：	2021-07-06
公开（公告）号：	CN113434685A	公开（公告）日：	2021-09-24
发明（设计）人：	徐晓健	申请（专利权）人：	中国银行股份有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/30;G06F16/953;G06N3/04
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	王天尧;谷敬丽
地址：	100818 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种资讯分类处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种资讯分类处理的方法及系统，涉及自然语言处理及机器学习技术领域，该方法包括：采集资讯数据，对所述资讯数据进行预处理；建立资讯分类模型，将预处理后的资讯数据输入至资讯分类模型中，通过所述资讯分类模型将资讯数据映射到高维空间得到文本中词语之间的关系，并利用LSTM提取文本特征的语义信息；根据文本特征的语义信息分析得到特征权重，按照特征权重进行信息增强，优化资讯分类模型；根据预处理后的资讯数据设置训练集及测试集，对优化后的资讯分类模型进行训练，并利用测试集对训练模型进行测试；获取待分类的资讯数据，利用训练完成的资讯分类模型对待分类的资讯数据进行类别划分，得到分类结果。

技术领域

本发明涉及自然语言处理及机器学习技术领域，尤指一种资讯分类处理的方法及系统。

背景技术

手机银行APP作为重要对客渠道，在银行数字化转型中发挥着重要的作用。为进一步提升客户体验，手机银行加入了资讯功能，考虑到每天均会产生各种新资讯，为更好地管理资讯，手机银行需要根据资讯内容对资讯进行分类；考虑到资讯数据量，单纯依靠人工的方式成本高昂且效率低下。

综上来看，亟需一种可以克服上述缺陷，能够高效、准确的进行资讯分类的技术方案。

发明内容

为解决现有技术存在的问题，本发明提出了一种资讯分类处理的方法及系统。本发明通过提取标题文本中信息，并对其进行加工后对资讯进行分类。

在本发明实施例的第一方面，提出了一种资讯分类处理的方法，该方法包括：

采集资讯数据，对所述资讯数据进行预处理；

建立资讯分类模型，将预处理后的资讯数据输入至资讯分类模型中，通过所述资讯分类模型将资讯数据映射到高维空间得到文本中词语之间的关系，并利用LSTM提取文本特征的语义信息；

根据文本特征的语义信息分析得到特征权重，按照特征权重进行信息增强，优化资讯分类模型；

根据预处理后的资讯数据设置训练集及测试集，对优化后的资讯分类模型进行训练，并利用测试集对训练模型进行测试；