[发明专利]语料所属情感类别的判别方法、装置、电子设备及介质在审
申请号: | 201811613553.9 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109710764A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 孟果 | 申请(专利权)人: | 湖南中周至尚信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F17/27;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 410000 湖南省长沙市开福区新河街道芙蓉中*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 情感分类模型 电子设备 贝叶斯 近义词 计算机可读存储介质 判别装置 申请 词汇 | ||
本申请公开了一种语料所属情感类别的判别方法,将无法利用贝叶斯情感分类模型判别所属情感类别的未判词,利用word2vec模型来找到可通过该贝叶斯情感分类模型判别所属情感类别的近义词,使得能够通过近义词对应的似然对数最终将这些本属于未判词的词汇也纳入最终判别目标语料所属情感类别的结果中,使得目标语料所属情感类别的判别更加准确。本申请还同时公开了一种语料所属情感类别的判别装置、电子设备及计算机可读存储介质,具有上述有益效果。
技术领域
本申请涉及自然语言处理技术领域,特别涉及一种语料所属情感类别的判别方法、装置、电子设备及计算机可读存储介质。
背景技术
随着信息技术的大发展,网络上充斥着大量的信息,其中不乏使用情感倾向严重词汇来恶意引导用户情绪的文章,为了让网络媒体更加公正、客观的描述事件,有必要监控语料的情感类别。
摆脱于由人工通过肉眼结合自身经验对语料所属情感类别的判别,现有技术中已经存在通过包含各情感类别词汇对应的抽象判别特征的贝叶斯情感分类模型,根据实际需求的不同,通常可以表现为二分类贝叶斯情感分类模型(分为敏感和非敏感)或三分类贝叶斯情感分类模型(敏感、非敏感、中性),但由于中文词汇的复杂性,使得总是有未包含于贝叶斯情感分类模型中的新词汇,而这些新词汇将会由于无法被贝叶斯情感分类模型给出判断结果导致最终得到的情感类别不准确。
因此,如何克服现有技术中因无法判别未包含于贝叶斯情感分类模型中的词汇所属情感类别导致对目标语料所属情感类别判别不准确的技术缺陷,是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种语料所属情感类别的判别方法、装置、电子设备及存储介质,旨在解决现有技术中因无法判别未包含于贝叶斯情感分类模型中的词汇所属情感类别导致对目标语料所属情感类别判别不准确的问题。
本申请的另一目的在于提供了一种云环境下服务的部署系统、装置及计算机可读存储介质。
为实现上述目的,本申请提供一种语料所属情感类别的判别方法,包括:
从目标语料中的核心段落中提取得到动/副动词和所述动/副动词的词频;
检测所述动/副动词是否存在于贝叶斯情感分类模型中;
将不存在于所述贝叶斯情感分类模型中的动/副动词标记为未判词;
在所述贝叶斯情感分类模型的词库中,利用word2vec模型寻找所述未判词的近义词;
根据所述贝叶斯情感分类模型确定所述动/副动词或所述动/副动词的近义词的似然对数;
根据各所述似然对数与对应词的词频的乘积的和判别所述目标语料所属的情感类别。
可选的,利用word2vec模型寻找所述未判词的近义词,包括:
利用所述word2vec模型分别计算每个所述未判词与每个存储于所述词库中的词的特征相关度;
将与每个所述未判词的特征相关度不小于预设阈值的词标记为对应未判词的近义词。
可选的,该判别方法还包括:
当利用所述word2vec模型寻得所述未判词的近义词的数量大于1时,从多个所述近义词中选取出与所述未判词的特征相关度最高的。
可选的,该判别方法还包括:
利用真实的近义词对和非近义词对测试所述word2vec模型的可用性;
当所述word2vec模型未通过可用性测试时,调整构成所述word2vec模型的各项参数直至通过可用性测试。
为实现上述目的,本申请还提供了一种语料所属情感类别的判别装置,该装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南中周至尚信息技术有限公司,未经湖南中周至尚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811613553.9/2.html,转载请声明来源钻瓜专利网。