[发明专利]一种基于概率情感词典的情感分析系统及方法有效
申请号: | 202010781151.0 | 申请日: | 2020-08-06 |
公开(公告)号: | CN111859925B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 信俊昌;王之琼;王司亓;隋玲;唐俊日;雷盛楠;汪宇;李嘉欣 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06N3/0464;G06V20/40;G06V10/774;G06V40/16;G06V10/80;G06V10/82 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 概率 情感 词典 分析 系统 方法 | ||
本发明公开一种基于概率情感词典的情感分析系统及方法,属于计算机自然语言处理技术领域。本发明在基于文本构建情感词典的基础上,提出基于文本、图片、视频构建的情感词典。采用深度置信网络的方式提取图片上的人脸表情特征来构建图像情感词典;采用卷积神经网络对视频的情感特征提取,构建视频情感词典;采用OpenSMILE进行情感特征提取,构建音频情感词典。对于缺失单一模态的情况,通过另外两种模态的信息特征拟合出缺失模态的特征,还增加反语判断机制,提高情感分析的准确度并解决在分析过程中某一模态缺失导致分析结果不准确这一问题。
技术领域
本发明涉及计算机自然语言处理技术领域,尤其涉及一种基于概率情感词典的情感分析系统及方法。
背景技术
情感分析是自然语言处理中常见的场景,主要根据大数据来定性定量分析人类情感,是大数据智能的重要体现。情感分析广泛应用在舆情监控、客服监控、电商评价等多个领域。例如各种微博评论、视频网站评价以及电商商品评论等,对于相关部门和人员能够更好了解用户情感需求具有关键性作用。通过对信息数据的情感分析,可以挖掘出项目产品在各个维度的优劣,从而明确如何改进项目产品。比如对视频网站的视频评价分析,可以分析用户喜好程度、视频类型以及受众群众等多个维度的用户情感指数,从而从各个维度上改进视频网站的视频上架和视频推广。目前,情感分析的方法可以采用基于情感词典的传统方法,先对文本进行分词和停用词处理等预处理,再利用先构建好的情感词典(一般由正面词、负面词、否定词以及程度副词等部分构建),对文本进行字符串匹配,将向量词组匹配到具体的词典中输出权值,最后计算总的权值从而分析出目标信息的情感是正面还是负面,同时具体分析出情感达到正面或者负面的那一种程度。也可以采用基于深度学习的情感分类,首先对文本进行分词、停用词、简繁转换等预处理,然后将分词结果转化为词向量,然后利用相关神经网络进行特征值提取进行特征提取,最后通过全连接层和Softmax输出每个分类的概率,从而得到情感分类。
但是,情感分析仍然存在局限性。数据信息拥有视频、图片以及文本等多种数据形式,然而大部分的情感分析方法以及目标都是针对文本进行情感分析。因此,现在很多的对数据信息进行情感分析的方法只是将数据中的文本提炼出来对其进行情感分析,都无法适用于多模态数据信息。这导致针对数据的情感分析,无法结合数据中的图片、视频以及音频等相关因素数据信息进行分析。并且在直接影响了情感分析的准确性。
发明内容
针对上述现有技术的不足,本发明提供一种基于概率情感词典的情感分析系统及方法
为解决上述技术问题,本发明所采取的技术方案是:
一种基于概率情感词典的情感分析系统,包括:
包括数据层、业务层、接口层和用户层;
所述数据层存储对于情感分析算法中所需要使用的不同模态下已标注过情感标签的训练集,以及用户待分析的视频数据;
所述业务层对数据存储层的数据进行训练和分析,包括图像特征提取模块、音频特征提取模块、文本特征提取模块和多模态情感分析模块;所述图像特征提取模块提取图片及从视频中拆分出来的视频图像的特征并存储;所述音频特征提取模块提取从视频中拆分出来的音频特征并存储;所述文本特征提取模块提取文本信息的特征并存储;
所述接口层包括待分析视频输入接口、情感分析结果可视化接口、应用系统调用接口和web应用调用接口;所述待分析视频输入接口将用户层的待分析视频传输至数据存储层进行存储;所述情感分解结果可视化接口将分析结果传输至用户层。
另一方面,本发明还提供采用上述的基于概率情感词典的情感分析系统进行情感分析的方法,包括如下两个阶段:
第一阶段:多模态情感词典的构建,包括如下步骤:
步骤1:采用已知情感词典库,调用已有的第三方网站的文本情感词典库构建本系统的文本情感词典;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010781151.0/2.html,转载请声明来源钻瓜专利网。