[发明专利]一种基于应用内实时数据的情感分析方法和系统在审
申请号: | 201910488327.0 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110390097A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 黄罡;李玲;姜海鸥;景翔;娄帅;崔磊 | 申请(专利权)人: | 北京大学(天津滨海)新一代信息技术研究院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/24;G06F16/33;G06F16/35;G06F16/9536;G06Q40/04 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 300452 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感分析 实时数据 应用 预处理 计算机技术领域 数据预处理 实时采集 数据模型 不一致 融合 | ||
1.一种基于应用内实时数据的情感分析方法,其特征在于,具体包括以下步骤:
步骤一、实时采集在应用内的数据;
步骤二、对采集的数据进行预处理;
步骤三、对预处理后的数据进行情感分析;
步骤四、根据步骤三中情感分析获取情感指数。
2.如权利要求1所述的一种基于应用内实时数据的情感分析方法,其特征在于,所述步骤二包括以下子步骤:
2.1词性标注,使用混合标记算法对数据进行词性标注成,使用结巴工具分词;
2.2噪声过滤,对分词后的数据中无关噪声进行过滤。
3.如权利要求1所述的一种基于应用内实时数据的情感分析方法,其特征在于,所述步骤三中,情感分析具体包括以下子步骤:
3.1词向量生成,将预处理后的数据中每个词映射成低维向量;
3.2构建句子表示,输入词向量,构建句子表示,保留文本的词序和上下文语义信息,生成句子向量;
3.3情感极性输出,经过语义处理后,将句子向量进行回归计算,输出两个正面和负面情感。
4.如权利要求1所述的一种基于应用内实时数据的情感分析方法,其特征在于,所述步骤四中,情感指数的计算为:
其中,pos是该时间范围内,正面情感评论数量,neg是该时间范围内,负面情感评论数量。
5.如权利要求1、2、3或4所述的一种基于应用内实时数据的情感分析方法,其特征在于,所述步骤一包括以下子步骤:
1.1搭建手机云后台环境,安装相应APP,将手机中的APP注册到API网关;使用APP搜索目标对象,点击目标对象对应的讨论区,抓取Trace控制文件,分析运行时模型并进行服务代码开发;
1.2前端通过接口文档调用特定接口服务,该调用请求首先经过API网关,API网关将请求分配到相应的手机;
1.3通过数据映射,从多个API组合中提取数据。
6.一种基于应用内实时数据的情感分析系统,其特征在于,包括实时数据采集模块、预处理模块、情感分析模块、指数计算模块;
实时数据采集模块将APP注册到API网关,可以从APP中提取评论的时间维度和文本数据;
预处理模块包括词性标注模块、噪声过滤模块,词性标注模块将文本数据使用混合标记算法进行词性标注,使用结巴工具分词;噪声过滤模块对数据中无关噪声进行过滤;
情感分析模块包括词向量生成模块、句子表示模块、情感极性输出模块,其中词向量生成模块将分词后的文本数据映射成低维向量;句子表示模块将低维词向量矩阵构建句子表示,生成句子向量;情感极性输出模块将文本向量进行回归计算,输出两个正面和负面情感;
情感指数模块可以计算一段时间范围内,某只股票的股评情感指数。
7.如权利要求6所述的一种基于应用内实时数据的情感分析系统,其特征在于,实时数据采集模块为Yancloud Hub应用。
8.如权利要求6所述的一种基于应用内实时数据的情感分析系统,其特征在于,情感指数模块对情感指数的计算为:
其中,pos是该时间范围内,正面情感评论数量,neg是该时间范围内,负面情感评论数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学(天津滨海)新一代信息技术研究院,未经北京大学(天津滨海)新一代信息技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910488327.0/1.html,转载请声明来源钻瓜专利网。