[发明专利]情感词向量构建方法及系统有效
申请号: | 201810932207.0 | 申请日: | 2018-08-16 |
公开(公告)号: | CN109271510B | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 徐泓洋;聂颖;郑权;张峰 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F17/27;G06K9/62 |
代理公司: | 北京博讯知识产权代理事务所(特殊普通合伙) 11593 | 代理人: | 柳兴坤;刘馨月 |
地址: | 519031 广东省珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种情感词向量构建方法及系统,该方法包括:S1:获取第一空间词向量模型、第二空间词向量模型以及第三空间词向量模型;S2:获取正强情感词表及负强情感词表;S3:利用第一空间词向量模型得到正强情感词表中每一个词对应的词向量,利用第二空间词向量模型得到负强情感词表中每一个词对应的词向量;S4:训练逻辑回归模型;S5:获取待处理词;S6:预测待处理词属于正类的概率和待处理词属于负类的概率;S7:根据待处理词属于正类的概率P+和待处理词属于负类的概率P_以及待处理词在第三空间词向量模型的词向量生成待处理词的情感词向量。本发明能够提高情感分类的准确率。 | ||
搜索关键词: | 词向量 词表 情感词 概率 第二空间 第一空间 向量构建 向量模型 空间词 逻辑回归模型 情感分类 准确率 向量 预测 | ||
【主权项】:
1.一种情感词向量构建方法,其特征在于,包括:步骤S1:获取第一空间词向量模型、第二空间词向量模型以及第三空间词向量模型,其中,所述第一空间词向量模型是利用第一训练样本集得到,所述第二空间词向量模型是利用第二训练样本集得到,所述第三空间词向量模型是利用第三训练样本集得到,所述第一训练样本集由若干个被标注为正情感类型的语料文本构成,所述第二训练样本集由若干个被标注为负情感类型的语料文本构成,所述第三训练样本集由所述若干个被标注为正情感类型的语料文本以及所述若干个被标注为负情感类型的语料文本共同构成;步骤S2:获取正强情感词表以及负强情感词表;步骤S3:利用所述第一空间词向量模型得到所述正强情感词表中每一个词对应的词向量v_p,利用所述第二空间词向量模型得到所述负强情感词表中每一个词对应的词向量v_n;步骤S4:利用所述正强情感词表中每一个词对应的词向量v_p以及所述负强情感词表中每一个词对应的词向量v_n训练逻辑回归模型;步骤S5:获取待处理词;步骤S6:根据所述待处理词在所述第一空间词向量模型的词向量、所述待处理词在所述第二空间词向量模型的词向量以及训练后的逻辑回归模型预测所述待处理词属于正类的概率P+和所述待处理词属于负类的概率P_;步骤S7:根据所述待处理词属于正类的概率P+和所述待处理词属于负类的概率P_以及所述待处理词在所述第三空间词向量模型的词向量生成所述待处理词的情感词向量;其中,所述步骤S7包括:采用以下方式计算所述待处理词的情感权重Ws:Ws=P+‑P_;采用以下方式生成所述待处理词的情感词向量v_s:v_s=Ws*v_a;其中,v_a为所述待处理词在所述第三空间词向量模型的词向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810932207.0/,转载请声明来源钻瓜专利网。