[发明专利]情感关键词的获取方法、装置、设备及存储介质在审
申请号: | 201811523511.6 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109783800A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 郭辉;戴祥鹰;林义明 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感关键词 目标文本 情感倾向 存储介质 语料 预设 标注 模型训练过程 反向处理 申请 工作量 | ||
1.一种情感关键词的获取方法,其特征在于,包括:
获取待处理的目标文本;
基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;
基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:
基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;
将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。
3.根据权利要求2所述的方法,其特征在于,所述将所述多个情感关键词中向量模值大于第一预设阈值的确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:
对所述多个情感关键词的向量进行高斯滤波处理,得到向量模值大于第一预设阈值的第二情感关键词。
4.根据权利要求1所述的方法,其特征在于,所述基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:
基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量,并计算所述目标文本的向量;
分别计算所述多个情感关键词中的每个情感关键词的向量模值与所述目标文本的向量模值之间的差值绝对值,将对应的差值绝对值大于第二预设阈值的情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。
5.根据权利要求1所述的方法,其特征在于,所述基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词,包括:
基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,得到所述目标文本中的多个情感关键词的向量;
基于所述多个情感关键词在所述目标文本中的位置,计算所述多个情感关键词中相邻两个情感关键词之间的向量模值的差值绝对值,将对应差值绝对值大于第三预设阈值的两个情感关键词确定为所述目标文本中影响所述目标文本情感倾向的第二情感关键词。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述获取待处理的目标文本,包括:
获取文本,并从所述文本中提取获得预设词性的词;
基于提取获得的所述预设词性的词,生成目标文本。
7.根据权利要求6所述的方法,其特征在于,所述基于提取获得的所述预设词性的词,生成目标文本,包括:
从提取获得的所述预设词性的词中提取词频在预设范围内的词;
基于提取获得的词频在预设范围内的词,生成目标文本。
8.一种情感关键词的获取装置,其特征在于,包括:
获取模块,用于获取待处理的目标文本;
情感倾向识别模块,用于基于预设的第一模型对所述目标文本进行处理,获得用于表达所述目标文本情感倾向的第一情感关键词,其中,所述第一模型是基于标注有情感倾向的语料训练获得的模型;
情感关键词提取模块,用于基于预设的第二模型对所述第一情感关键词进行所述处理的反向处理,获得所述目标文本中影响所述目标文本情感倾向的第二情感关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811523511.6/1.html,转载请声明来源钻瓜专利网。