[发明专利]一种情境感知的深度学习算法有效
申请号: | 202010027050.4 | 申请日: | 2020-01-10 |
公开(公告)号: | CN111428492B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 谭旭;曹自强;高凯;吕欣 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/242;G06F16/951;G06F16/9536;G06F18/214;G06N3/0442;G06N3/045;G06N3/0475;G06N3/08;G06N20/00 |
代理公司: | 深圳市辉泓专利代理有限公司 44510 | 代理人: | 吴杰辉;郝思楠 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情境 感知 深度 学习 算法 | ||
一种情境感知的深度学习算法,针对现有医疗舆情情感分析方法不足以区分复杂情感中细粒度的目标指向的问题,提出一种情境感知的深度学习算法——CAN‑LSTM,用于识别医疗舆情中不同认知层次的情感:首先利用LDA主题模型从大量的负面评论中挖掘民众在医疗事件中的不同认知层次;然后在各层次情境中不同评论的影响力的条件下,利用LSTM进行训练情感分析预测模型。本发明的有益效果在于:1.有效识别了医疗舆情中不同认知层次的情感;2.三种加权的CAN‑LSTM模型预测的准确率优于主流的LSTM算法。
技术领域
本发明涉及一种算法,具体涉及一种情境感知的深度学习算法及模型。
背景技术
文本情感分析(简称SA)是指利用自然语言处理和文本挖掘的技术,对包含个人情感、喜好、观点等主观性文本进行分析、挖掘的过程。当前情感分析的方法主要包括基于词典规则的方法和基于机器学习的方法。基于词典规则的方法首先需要构建情感词典,在此基础上提取出情感关键词,分析文本中的积极、消极情感词频,判断文本的情感倾向。基于机器学习的方法首先需要人工标注句子的情感类别,然后选择文本中的情感词,并将其矩阵化,用机器学习的算法对其进行分类。
但上述两种方法都存在明显不足,一方面,基于词典的情感识别算法需要构建特定领域的情感词典,这使得为每个领域注释大量数据的成本十分高昂,已成为构建高质量系统的瓶颈;另一方面,基于机器学习的情感识别算法也在很大程度上依赖于人工特征选择。因此,这两类方法对于复杂文本数据的情感识别效果并不理想。而且在医疗事件的网络舆情中,负面倾向通常占据主导地位,而现有两种方法却不足以区分复杂情感中细粒度的目标指向。如何设计出精准预警的医疗舆情算法是目前医疗预警面临的一个主要挑战,吸引了学者的广泛关注。
针对现有医疗舆情情感分析方法不足以区分复杂情感中细粒度的目标指向的问题,提出一种情境感知的深度学习算法——CAN-LSTM,用于识别医疗舆情中不同认知层次的情感。
发明内容
本申请首先利用LDA主题模型从大量的负面评论中挖掘民众在医疗事件中的不同认知层次;然后在各层次情境中不同评论的影响力的条件下,利用LSTM进行训练情感分析预测模型。
LDA主题模型的基本思想是将文档表示为若干主题的随机组合,而每个主题又表示为若干词条的概率分布。给定文档集D={d1,d2,...,dN},其中di(i=1,2,...,N)为若干词条组成的文本。假设主题集Toc={t1,t2,...,tL},词条集W={w1,w2,...,wM},则LDA主题模型中的“文本-主题”概率分布θd和“主题-词条”概率分布分别满足以α和β为超参数的Dirichlet分布,如式(1)和式(2)所示。
其中,Γ(·)为Gamma函数,θd,j表示主题tj在文本d中的概率分布,且满足表示词条wk在主题tj中的概率分布,且满足
对于文档集D中的每篇文档,LDA定义了基本的主题生成过程,分为以下步骤:
(i)对于每一篇文档di(i=1,2,...,N),生成L个主题的概率分布θd=(θd,1,θd,2,...,θd,L),使得θd~P(·|α);
(ii)对于每一个主题ti(i=1,2,...,L),生成K个词条的概率分布使得
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010027050.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有低温线圈的能量转换装置
- 下一篇:一种控制机床的方法及机床