[发明专利]一种情感倾向分析方法及系统在审
申请号: | 202110137402.6 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112925906A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 潘钰;刘远;杨森 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F40/205;G06F40/247;G06F40/284;G06F40/289;G06F40/30;G06Q10/04;G06Q40/04 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 倾向 分析 方法 系统 | ||
1.一种情感倾向分析方法,其特征在于,包括:
爬取步骤:爬取舆情文本,获取爬取后的舆情文本;
预处理步骤:预处理爬取后的所述舆情文本,获取预处理后的舆情文本;
获取步骤:使用预处理后的所述舆情文本,获取word2vec词向量模型后,对所述word2vec词向量模型中的向量进行情感倾向分类,获取情感倾向分类器;
分析步骤:通过所述情感倾向分类器去分析实时舆情文本的情感倾向。
2.根据权利要求1所述的情感倾向分析方法,其特征在于,所述爬取步骤包括,选取所述舆情文本作为挖掘与分析的对象,并爬取所述舆情文本,获取爬取后的所述舆情文本。
3.根据权利要求1所述的情感倾向分析方法,其特征在于,所述预处理步骤包括,对爬取后的所述舆情文本进行清洗、去噪、分词、去除停用词操作后,获取预处理后的所述舆情文本。
4.根据权利要求1所述的情感倾向分析方法,其特征在于,所述获取步骤包括,使用预处理后的所述舆情文本,训练word2vec模型后,使用所述word2vec模型将预处理后的所述舆情文本中的词转换为向量,并获取所述word2vec词向量模型后,对所述word2vec词向量模型中的所述向量进行情感倾向分类,将情感倾向分类后的所述向量分为训练集与测试集,并根据所述训练集与所述测试集获取所述情感倾向分类器。
5.根据权利要求1所述的情感倾向分析方法,其特征在于,所述分析步骤包括,根据一个所述实时舆情文本,通过所述情感倾向分类器分析所述实时舆情文本的所述情感倾向。
6.一种情感倾向分析系统,其特征在于,适用于上述权利要求1-5所述的情感倾向分析方法,所述情感倾向分析系统包括:
爬取单元:爬取舆情文本,获取爬取后的舆情文本;
预处理单元:预处理爬取后的所述舆情文本,获取预处理后的舆情文本;
获取单元:使用预处理后的所述舆情文本,获取word2vec词向量模型后,对所述word2vec词向量模型中的向量进行情感倾向分类,获取情感倾向分类器;
分析单元:通过所述情感倾向分类器去分析实时舆情文本的情感倾向。
7.根据权利要求6所述的情感倾向分析系统,其特征在于,所述爬取单元选取所述舆情文本作为挖掘与分析的对象,并爬取所述舆情文本,获取爬取后的所述舆情文本。
8.根据权利要7所述的情感倾向分析系统,其特征在于,所述预处理单元对爬取后的所述舆情文本进行清洗、去噪、分词、去除停用词操作后,获取预处理后的所述舆情文本。
9.根据权利要求8所述的情感倾向分析系统,其特征在于,使用预处理后的所述舆情文本,训练word2vec模型后,使用所述word2vec模型将预处理后的所述舆情文本中的词转换为向量,并通过获取单元获取所述word2vec词向量模型后,对所述word2vec词向量模型中的所述向量进行情感倾向分类,将情感倾向分类后的所述向量分为训练集与测试集,并根据所述训练集与所述测试集获取所述情感倾向分类器。
10.根据权利要求9所述的情感倾向分析系统,其特征在于,所述分析单元根据一个所述实时舆情文本,通过所述情感倾向分类器分析所述实时舆情文本的所述情感倾向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110137402.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种受流器
- 下一篇:硫化铜的应用、硫化铜纳米复合材料及其制备方法与应用