[发明专利]情感语料库的扩展方法、装置及计算机可读存储介质在审
申请号: | 202010248850.9 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111552815A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 过弋;王志宏;尹心明;樊志杰;陈家明;王家辉;张重磊;蔡新玮 | 申请(专利权)人: | 华东理工大学;公安部第三研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 200237 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 语料库 扩展 方法 装置 计算机 可读 存储 介质 | ||
1.一种情感语料库的扩展方法,其特征在于,包括:
获取标准情感语料库,所述标准情感语料库包括多个标准情感词以及与所述标准情感词对应存储的标准情感极性和标准情感类别;
根据所述标准情感词获取扩展语料,并将所述扩展语料添加存储至所述标准情感语料库;
根据所述标准情感极性计算所述扩展语料的情感极性,并将所述扩展语料的情感极性与所述扩展语料关联存储至所述标准情感语料库;
根据所述标准情感类别获取所述扩展语料的情感类别,并将所述扩展语料的情感类别与所述扩展语料关联存储至所述标准情感语料库。
2.根据权利要求1所述的情感语料库的扩展方法,其特征在于,所述扩展语料包括扩展词语,所述根据所述标准情感词获取扩展语料,具体包括:
获取与所述标准情感词的词向量相似度大于第一预设相似度的词语作为候选词语,得到多个所述候选词语;
获取各个所述候选词语与其它所述候选词语之间的词向量相似度作为候选相似度,得到各个所述候选词语的多个候选相似度;
获取各个所述候选词语的多个所述候选相似度中、大于第二预设相似度的所述候选相似度的数量,作为各个所述候选词语的候选数量;
将所述候选数量大于预设阈值的所述候选词语作为所述扩展词语。
3.根据权利要求2所述的情感语料库的扩展方法,其特征在于,所述根据所述标准情感极性计算所述扩展语料的情感极性,具体包括:
获取各个所述标准情感词与所述扩展词语的词向量相似度作为采样相似度;
获取所述采样相似度大于第三预设相似度的多个所述标准情感词作为采样标准情感词;
获取与所述采样标准情感词所对应的所述标准情感极性作为采样标准情感极性;
计算各个所述采样标准情感词所对应的所述采样相似度和所述采样标准情感极性的乘积;
将所述乘积累加;若所述累加的结果为正,则所述扩展词语的情感极性为1;若所述累加的结果为负,则所述扩展词语的情感极性为-1。
4.根据权利要求3所述的情感语料库的扩展方法,其特征在于,所述根据所述标准情感类别获取所述扩展语料的情感类别,具体包括:
获取所述采样标准情感词所对应的所述标准情感类别作为采样标准情感类别;
将所述采样标准情感类别中数量最多的所述情感类别作为所述扩展词语的情感类别。
5.根据权利要求1所述的情感语料库的扩展方法,其特征在于,所述扩展语料包括扩展表情符号,所述根据所述标准情感词获取扩展语料,具体包括:
获取语句样本库,所述语句样本库中包含多条语句;
获取与所述标准情感词共同出现在同一语句中的表情符号作为所述扩展表情符号。
6.根据权利要求5所述的情感语料库的扩展方法,其特征在于,所述根据所述标准情感极性计算所述扩展语料的情感极性,具体包括:
获取与所述扩展表情符号共同出现在同一语句中的标准情感词作为采样标准情感词;
获取与所述采样标准情感词所对应的所述标准情感极性作为采样标准情感极性;
计算所述采样标准情感极性的和作为所述扩展表情符号的情感极性。
7.根据权利要求5所述的情感语料库的扩展方法,其特征在于,所述根据所述标准情感类别获取所述扩展语料的情感类别,具体包括:
根据所述标准情感类别获取所述扩展表情符号的情感显著性和情感相关性,所述情感显著性用于表征所述扩展表情符号表达不同情感类别的强度,所述情感相关性用于表征所述扩展表情符号区分不同情感类别的能力;
根据所述情感显著性和所述情感相关性的乘积获取所述扩展表情符号的情感类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学;公安部第三研究所,未经华东理工大学;公安部第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010248850.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种寻呼方法和寻呼设备
- 下一篇:机械混合复合陶瓷粉火焰喷涂施工方法