[发明专利]一种基于应用内实时数据的情感分析方法和系统在审
申请号: | 201910488327.0 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110390097A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 黄罡;李玲;姜海鸥;景翔;娄帅;崔磊 | 申请(专利权)人: | 北京大学(天津滨海)新一代信息技术研究院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/24;G06F16/33;G06F16/35;G06F16/9536;G06Q40/04 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 300452 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感分析 实时数据 应用 预处理 计算机技术领域 数据预处理 实时采集 数据模型 不一致 融合 | ||
本发明涉及计算机技术领域,特别涉及一种基于应用内实时数据的情感分析方法和系统。具体包括以下步骤:步骤一、实时采集在应用内的数据;步骤二、进行预处理;步骤三、进行情感分析;步骤四、获取情感指数。本发明解决不同应用内数据模型不一致的难点。之后融合多个API组合的实时数据完成数据预处理工作,实现在接口基础上,直接进行情感分析工作。
技术领域
本发明涉及计算机技术领域,特别涉及一种基于应用内实时数据的情感分析方法和系统。
背景技术
在移动应用APP经济向API经济转型的背景下,移动应用服务化趋势逐渐明显,移动应用拥有大量实时、丰富、多维的数据和功能,网页端获取数据愈发困难。在我国股票领域,股民的股票投资很大程度上受社交媒体影响,情绪化程度较重。北京大学软件研究所提出的Yancloud Hub应用可在不依赖源代码的情况下将移动应用服务化,实现应用内实时数据开放。因此,基于Yancloud Hub应用,获取多款安卓股票应用内实时数据,通过实时股评数据快速分析出股民情绪波动趋势,为股民和投资者提供决策支持,非常的重要。
发明内容
本发明实施例提供了一种基于应用内实时数据的情感分析方法和系统,首先完成应用内实时数据获取与分析处理工作,解决了不同应用内数据模型不一致的难点。
根据本发明实施例的第一方面,一种基于应用内实时数据的情感分析方法,具体包括以下步骤:
步骤一、实时采集在应用内的数据;
步骤二、对采集的数据进行预处理;
步骤三、对预处理后的数据进行情感分析;
步骤四、根据步骤三中情感分析获取情感指数。
所述步骤二中,数据预处理包括以下子步骤:
2.1词性标注,使用混合标记算法对数据进行词性标注成,使用结巴工具分词;
2.2噪声过滤,对分词后的数据中无关噪声进行过滤。
所述步骤三中,情感分析具体包括以下子步骤:
3.1词向量生成,将预处理后的数据中每个词映射成低维向量;
3.2构建句子表示,输入词向量,构建句子表示,保留文本的词序和上下文语义信息,生成句子向量;
3.3情感极性输出,经过语义处理后,将句子向量进行回归计算,输出两个正面和负面情感。
所述步骤四中,情感指数的计算为:
其中,pos是该时间范围内,正面情感评论数量,neg是该时间范围内,负面情感评论数量。
所述步骤一中,具体包括以下子步骤:
1.1搭建手机云后台环境,安装相应APP,将手机中的APP注册到API网关;使用APP搜索目标对象,点击目标对象对应的讨论区,抓取Trace控制文件,分析运行时模型并进行服务代码开发;
1.2前端通过接口文档调用特定接口服务,该调用请求首先经过API网关,API网关将请求分配到相应的手机;
1.3通过数据映射,从多个API组合中提取数据。
一种基于应用内实时数据的情感分析系统,包括实时数据采集模块、预处理模块、情感分析模块、指数计算模块;
实时数据采集模块将APP注册到API网关,可以从APP中提取评论的时间维度和文本数据;
预处理模块包括词性标注模块、噪声过滤模块,词性标注模块将文本数据使用混合标记算法进行词性标注,使用结巴工具分词;噪声过滤模块对数据中无关噪声进行过滤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学(天津滨海)新一代信息技术研究院,未经北京大学(天津滨海)新一代信息技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910488327.0/2.html,转载请声明来源钻瓜专利网。