[发明专利]情感分析方法、装置、设备及存储介质有效
申请号: | 201811542306.4 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109684634B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 牛国成;何伯磊;刘昊;杨水生;王晨秋;肖欣延;吕雅娟;吴甜 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F40/247 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 分析 方法 装置 设备 存储 介质 | ||
1.一种情感分析方法,其特征在于,包括:
获取情感分析请求,其中,所述分析请求中包括第一文本数据及所述第一文本数据所属的目标领域;
对所述第一文本数据进行切词处理,以确定所述第一文本数据中包括的各第一分词;
通过查询与所述目标领域关联的词典,在查找到的与目标领域关联的词典中,获取每个第一分词对应的词向量;
将所述第一文本数据中每个第一分词对应的词向量,输入与所述目标领域对应的情感分析模型,以确定所述第一文本数据对应的情感类型;
所述获取每个第一分词对应的词向量之前,还包括:
获取与第一领域对应的标注数据集,其中,所述标注数据集中包括多个第二文本数据及每个第二文本数据对应的情感类型;
基于所述多个第二文本数据及每个第二文本数据对应的情感类型,对预设的初始情感分析模型进行模型调整,以生成与所述目标领域对应的情感分析模型及词典。
2.如权利要求1所述的方法,其特征在于,所述确定所述第一文本数据中包括的各第一分词之后,还包括:
对每个第一分词进行词法分析,以确定所述每个第一分词对应的词性;
根据所述每个第一分词及每个第一分词对应的词性,确定每个第一分词的词特征;
所述获取每个第一分词对应的词向量,包括:
确定与所述每个第一分词的词特征对应的词向量。
3.如权利要求1或2所述的方法,其特征在于,所述获取与所述第一领域对应的标注数据集之后,还包括:
对所述标注数据集进行预处理,以确定所述标注数据集中每个第二分词的词频;
根据所述每个第二分词的词频,将所述标注数据集中词频小于阈值的各第二分词进行归一化处理。
4.如权利要求1或2所述的方法,其特征在于,所述获取与所述第一领域对应的标注数据集之后,还包括:
将所述标注数据集中的每个第二文本数据进行切词处理,以确定每个第二文本数据中每个第二分词;
通过查询预设的初始词典,确定每个第二分词对应的词向量;
所述基于所述多个第二文本数据及每个第二文本数据对应的情感类型,对预设的初始情感分析模型进行模型调整,包括:
基于所述每个第二文本数据中每个第二分词对应的词向量及每个第二文本数据对应的情感类型,对预设的初始情感分析模型进行模型调整。
5.如权利要求1或2所述的方法,其特征在于,所述基于所述多个第二文本数据及每个第二文本数据对应的情感类型,对预设的初始情感分析模型进行模型调整,包括:
对所述标注数据集进行数据划分,以获取与所述目标领域对应的训练集及校验集;
基于所述训练集及校验集中每个第二文件数据及对应的情感类型,对预设的初始情感分析模型进行模型调整。
6.如权利要求5所述的方法,其特征在于,所述对所述标注数据集进行数据划分之后,还包括:
获取与所述目标领域对应的测试集;
利用所述测试集,对所述目标领域对应的情感分析模型进行测试,以确定所述目标领域对应的情感分析模型的准确性;
所述确定所述第一文本数据对应的情感类型,包括:
确定所述第一文本数据对应的每种情感类型的第一概率值;
根据所述目标领域对应的情感分析模型的准确性,对所述第一文本数据对应的每种情感类型的第一概率值进行修正,以确定所述第一文本数据对应的每种情感类型的第二概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811542306.4/1.html,转载请声明来源钻瓜专利网。