[发明专利]一种应用于搜索引擎的情感映射方法与情感句型分析方法有效
申请号: | 201210308445.7 | 申请日: | 2012-08-28 |
公开(公告)号: | CN102867028A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 张钫炜;刘浩;陆月明 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 搜索引擎 情感 映射 方法 句型 分析 | ||
技术领域
本发明涉及一种应用于搜索引擎的多情感倾向度映射方法与情感句型结构分析方法,属于计算机科学技术与语言学的交叉领域。
背景技术
搜索引擎作为用户与海量网络数据交互的中间站,使用户能快速准确地获取有用信息,在当今的网络技术发展中占据着非常重要的角色。近几年兴起的情感分析领域,正是搜索引擎的一个重要发展分支。情感分析通过分析自然语言的语义可以确定用户的情感倾向度,搜索引擎利用情感分析,可以获取用户的情感倾向度,为用户提供个性优化的搜索结果。
国内关于情感分析的研究主要集中在倾向度分析,这其中又包括两个重要的方向。一类是基于大规模情感语料库的,计算词汇与上下文的统计特性,并将其作为情感倾向度的特征。较为著名的有中科院谭松波博士文本情感倾向度分析方法。另一类是基于语义网的结构的,根据概念的上下位、同义反义等关系,获得概念距离,作为情感倾向度的特征。较为著名的有中科院董振东教授提出的知网体系(Hownet)。
心理学家Robert Plutchik认为情绪是心理演化的综合体,他提出了八种两两相对的基本情感,即:(Anger)愤怒、(Fear)害怕、(Anticipation)希望、(Surprise)惊奇、(Disgust)嫌弃、(Trust)信任、(Joy)快乐、(Sadness)悲哀,并以情感模型的形式将这八种情感及它们的混合情感呈现出来。然而,他没有给出情感的定量表达,这给其情感模型的应用造成诸多不便。
J.R.Martin与P.R.R.White所著的《英语评价系统》在鉴别句子语义方面享有极高的地位。他们将语篇语义的评价系统分为三个子系统,即态度(attitude)、介入(engagement)、极差(graduation)。态度即人的态度,介入即语句中如何通过词体现态度,极差即态度的真伪、强弱。通过分析句子的态度、介入、极差三个方面,即可得到说话者想要表达的态度。其标注体系为:情感持有者(emotion holder),情感受体(object),受体特征(object feature),情感倾向度(emotions),情感词(emotion word)。为了简化系统,我们只选取了情感倾向度和情感词进行了标注。
在中文文本情感分析领域,大部分的情感分析研究局限在两种(正面、负面)或者三种(正面、中性、负面)情感分析,而准确把握一般人的情感态度需要更为细致的情感分析。本发明正是针对目前情感分析领域中存在的情感倾向度分析不够丰富、准确度不高的问题,提出了一种应用于搜索引擎的多情感倾向度映射方法与情感句型结构分析方法,量化情感倾向度,发掘隐含情感倾向,有效地解决上述问题。
发明内容
本发明提出了一种应用于搜索引擎的多情感倾向度映射方法与情感句型结构分析方法,结合心理学与语言学针对情感进行分析,计算情感句的情感倾向度。本发明包括多情感倾向度映射方法和情感句型结构分析方法两部分,其中,多情感倾向度映射方法包括情感分词模块、情感词库和多倾向度映射模块三个部分,情感句型结构分析方法包括句型结构模版库和句型结构分析模块两个部分。它们之间的关系如说明书附图1所示。
下面对多情感倾向度映射方法的三个部分进行说明。
1.情感分词标注模块。该模块完成的功能包括情感句断句、分词,根据情感词典标注情感词及程度副词三个部分。下面详细介绍情感标注的标准。
(1)断句的标注符。我们将句号“。”、分号“;”作为判断一个句子结束的标志,标注符为/wsg,其他标点符号参考ICTCLAS进行标注。
(2)基础情感词的标注符。参考情感词库中的情感词,将基础情感词的情感倾向度进行情感标注,使用作为标示符。定义强化基础情感的强度为1.5,基础情感的强度为1,弱化基础情感的强度为0.5。标注时并不标注情感强度,任情感向量映射时根据标注符判断情感词的情感强度,并将其映射为情感倾向度向量的模值。
表1基础情感标注表(24类)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210308445.7/2.html,转载请声明来源钻瓜专利网。