[发明专利]舆情分析方法及装置、存储介质、电子设备有效
申请号: | 201711328767.7 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108255805B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 王建社;柳林;刘海波;韩辉;杨帆;陈涛;冯祥;胡国平;刘俊华;殷兵;张程风 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G10L15/26 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民 |
地址: | 230000 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 分析 方法 装置 存储 介质 电子设备 | ||
1.一种舆情分析方法,其特征在于,所述方法包括:
获取待分析语音数据,将所述待分析语音数据转换为待分析文本,并从所述待分析文本中确定出与预设话题相符的目标话题;
从所述待分析文本中分割出所述目标话题对应的目标文本片段,并提取所述目标文本片段中每个单词的词向量;所述词向量还包括:目标文本片段中每个句子结束位置的标点符号所对应的每个符号类单词的词向量;从所述待分析语音数据中分割出所述目标话题对应的目标语音片段,并对所述目标语音片段进行情感分析,获得所述目标语音片段的情感类别向量,作为所述目标话题的条件信息向量;所述条件信息向量还包括:目标文本片段中每个句子结束位置的标点符号所对应的标点类别向量;
将所述词向量和所述条件信息向量作为输入,经预先构建的情感判别模型处理后,确定出所述目标话题对应的情感类别。
2.根据权利要求1所述的方法,其特征在于,所述从所述待分析文本中确定出与预设话题相符的目标话题,包括:
对所述待分析文本进行话题分割,得到至少一个待识别话题;
确定每个待识别话题的话题类别,将与所述预设话题的话题类别相同的待识别话题,确定为所述目标话题。
3.根据权利要求1所述的方法,其特征在于,所述提取所述目标文本片段中每个单词的词向量,包括:
对所述目标文本片段进行分词处理,得到至少一个文字类单词;
对所述目标文本片段进行分句处理,确定出每个句子结束位置的标点符号,得到至少一个符号类单词;
提取每个文字类单词、以及每个符号类单词的词向量。
4.根据权利要求3所述的方法,其特征在于,所述词向量包括当前单词wi的本身词向量e(wi),以及以下词向量中的至少一个:
表示所述当前单词wi上文信息的上文词向量cl(wi)、表示所述当前单词wi下文信息的下文词向量cr(wi)。
5.根据权利要求1所述的方法,其特征在于,所述情感判别模型的拓扑结构为卷积神经网络或者循环卷积神经网络,所述将所述词向量和所述条件信息向量作为输入,经预先构建的情感判别模型处理后,确定出所述目标话题对应的情感类别,包括:
将所述词向量和所述条件信息向量作为输入,经神经网络的卷积层处理后,得到每个单词的特征映射值;
将所述每个单词的特征映射值作为输入,经所述神经网络的池化层进行池化处理后,输出至所述神经网络的输出层,由所述输出层确定出所述目标话题对应的情感类别。
6.根据权利要求5所述的方法,其特征在于,在进行池化处理之前,所述方法还包括:
拼接所述条件信息向量和所述每个单词的特征映射值,获得拼接向量,再由所述池化层对所述拼接向量进行池化处理。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
对所述目标文本片段进行分句处理,确定出每个句子结束位置的标点符号,得到所述目标文本片段的标点类别向量,作为所述目标话题的条件信息向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711328767.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语言交流人工智能系统及其语言处理方法
- 下一篇:一种人名识别方法及装置