[发明专利]一种基于约束关系的意见目标和情感词联合聚类方法有效
申请号: | 201310701519.8 | 申请日: | 2013-12-18 |
公开(公告)号: | CN103646097A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 牛振东;黄胜;刘沙;陈杰 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于Web评论文本的意见挖掘技术领域,涉及一种基于约束关系的意见目标和情感词联合聚类方法。该方法通过引入意见目标之间的正向和反向约束关系,提供了意见目标之间属于相同特征类或者不同特征类的先验关系,从而在对意见目标集合进行基于特征的聚类过程中,提高意见目标聚类结果的准确率。通过引入情感词之间的正向和反向约束关系,提供了情感词之间关联于相同特征类或者不同特征类的先验关系,从而在对情感词集合按照与评价特征类的关联关系进行聚类的过程中,提高情感词聚类结果的准确率。与传统无约束的意见目标和情感词聚类方法相比,本发明所述方法应归属为有约束的方法。并且在聚类的效果中,准确率提高8.3%,召回率提高7.7%。 | ||
搜索关键词: | 一种 基于 约束 关系 意见 目标 情感 联合 方法 | ||
【主权项】:
1.一种基于约束关系的意见目标和情感词联合聚类方法,其特征在于, 首先对意见目标的约束关系进行定义: 意见目标的正向约束关系:如果两个意见目标之间存在共同的名词或者名词短语,则定义两者之间存在意见目标的正向约束关系; 意见目标的反向约束关系:在同一个评论文本单元中,如果意见目标之间存在句子级别上的共现关系,或者意见目标之间具有相反的评价意见倾向,则定义它们之间存在意见目标的反向约束关系; 其次对情感词的约束关系进行定义; 已知和分别表示与情感词oi与oj相关联的的意见目标集合,定义与之间的重合度Overlap为:其中,表示对集合取模操作;定义λ1为正向约束阈值参数,λ2为反向约束阈值参数,如果则定义情感词oi和oj之间具有情感词的正向约束关系;如果则定义oi和oj之间具有情感词的反向约束关系;根据上述意见目标和情感词的约束关系定义,对意见目标和情感词进行基于约束关系的联合聚类,具体步骤如下: 步骤1、在用户评论数据中对意见目标、情感词以及情感词对应的意见目标集合进行采集和预处理 步骤2、在步骤1抽取的意见目标集合基础上,抽取意见目标的正向和反向约束关系 (1)意见目标的正向约束关系抽取:根据本发明定义的意见目标的正向约束关系,利用词法分析技术抽取意见目标之间的正向约束关系; (2)意见目标的反向约束关系抽取:根据本发明定义的意见目标的反向约束关系,在用户评论文本集合中,抽取意见目标之间的反向约束关系; (3)冲突消解:抽取的意见目标集合中可能存在着两个结点之间同时存在正 向约束和反向约束的情况;当正向约束和反向约束发生冲突时,仅保留出现频率较高的约束关系类型; 步骤3、在步骤1抽取的情感词集合以及与情感词相关联的意见目标集合的基础上,抽取情感词的约束关系 根据本发明定义的情感词的正向和反向约束关系,利用与情感词相关联的意见目标集合计算情感词之间的重合度,以此来识别情感词之间的正向和反向约束关系; 步骤4、在步骤2和步骤3的基础上,构建意见目标约束关系矩阵和情感词约束关系矩阵 (1)根据意见目标集合F中意见目标词之间的正向约束关系构建意见目标的正向约束关系矩阵DF,如下所示: 其中[DF]ij表示矩阵DF中的元素;fi和fj分别代表意见目标集合F中的两个意见目标词;i和j代表意见目标集合中第i个意见目标和第j个意见目标; (2)根据意见目标集合F中意见目标词之间的反向约束关系构建意见目标的反向约束关系矩阵RF,如下所示: 其中[RF]ij表示矩阵RF中的元素;fi和fj分别代表意见目标集合F中的两个意见目标词;i和j代表意见目标集合中第i个意见目标和第j个意见目标; (3)根据情感词集合O中情感词之间的正向约束关系构建情感词的正向约束关系矩阵DO,如下所示: 其中[Do]ij表示矩阵Do中的元素;oi和oj分别代表情感词集合O中的两 个情感词;i和j代表情感词集合中第i个情感词和第j个情感词; (4)根据情感词集合O中情感词之间的反向约束关系构建情感词的反向约束关系矩阵RO,如下所示: 其中[RO]ij表示矩阵RO中的元素;oi和oj分别代表情感词集合O中的两个情感词;i和j代表情感词集合中第i个情感词和第j个情感词; 步骤5、构建意见目标和情感词关联矩阵 步骤6、在步骤4和步骤5的基础上,进行基于约束的联合聚类求解 步骤7、根据步骤6的求解结果,将意见目标集合和情感词集合进行类别划分和关联配对 对用户评论文本的意见目标集合按照意见目标维度聚类后的结果划分类别,对用户评论文本的情感词集合按照情感词维度聚类后的结果划分类别,同时选择具有最大关联概率的意见目标类和情感词类进行配对,构建意见目标类和情感类的关联关系,用于意见挖掘任务中后续的生成评论摘要和产品情感倾向性分析等。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310701519.8/,转载请声明来源钻瓜专利网。
- 上一篇:玉米秸秆青贮法
- 下一篇:扫描机台程式控制方法