[发明专利]情感词典构建系统及构建方法有效
申请号: | 201810777409.2 | 申请日: | 2018-07-16 |
公开(公告)号: | CN109190106B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 殷复莲;王颜颜;刘剑波;贺夏婷;苏沛;吴佳乐;邵雪莹 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/216;G06F16/35 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张超艳;陈英俊 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供情感词典构建系统及方法,包括:设定情感词属于每一情感极性的情感强度条件,第一条件为情感强度与情感词及其词性在每一类文档中出现频次成正相关,第二条件为情感强度与情感词在每一类文档中出现频次成正相关,第三条件为情感强度与情感词在正类文档和负类文档中出现频次差的绝对值成正相关,第四条件为情感强度与情感词在正类文档和负类文档中出现频次和成负相关;上述条件结合TF‑IDF方法构建条件模型;根据条件模型构建情感词及其词性属于不同情感极性的情感强度模型;根据情感词及其词性属于正极性的情感强度与其属于负极性的情感强度的差值构建情感值模型。上述系统及方法将词性及类内分布因素结合,提高分类准确性。 | ||
搜索关键词: | 情感 词典 构建 系统 方法 | ||
【主权项】:
1.一种情感词典构建系统,其特征在于,包括:采集部,采集文档;分词部,对文档进行分词,得到文档内的情感词;文档分类部,将采集部采集的文档分为正类文档和负类文档;设定部,设定确定情感词属于每一情感极性的情感强度的条件,所述情感极性包括正极性、负极性和中性,所述条件包括第一条件、第二条件、第三条件和第四条件中的一个或多个,所述第一条件为情感强度与情感词及其词性在每一类文档中出现频次成正相关,所述第二条件为情感强度与情感词在每一类文档中出现频次成正相关,所述第三条件为情感强度与情感词在正类文档和负类文档中出现频次差的绝对值成正相关,所述第四条件为情感强度与情感词在正类文档和负类文档中出现频次和成负相关;条件模型构建部,根据设定部设定的条件结合TF或/和IDF方法构建条件模型,所述条件模型包括第一条件结合TF方法形成的第一TF模型、第二条件结合TF方法形成的第二TF模型、第三条件结合TF方法形成的第三TF模型和第四条件结合IDF方法形成的IDF模型中的一个或多个;情感强度模型构建部,根据条件模型构建情感词及其词性属于不同情感极性的情感强度模型,所述情感强度模型为条件模型中的任一个模型或为条件模型中多个模型的组合;情感值模型构建部,根据情感词及其词性属于正极性的情感强度与其属于负极性的情感强度的差值构建情感值模型,情感值为正值将情感词归属于正极性,情感值为负值将情感词归属于负极性,情感值为0将情感词归属于中性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810777409.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种企业舆情宏观情感分析方法
- 下一篇:智能对话方法和装置