[发明专利]一种基于情感分析的UGC模糊综合评价方法在审
申请号: | 201610131279.6 | 申请日: | 2016-03-08 |
公开(公告)号: | CN105718446A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 徐勇;张慧;李东勤;陈亮;梁后军;魏苏林 | 申请(专利权)人: | 徐勇 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N7/02;G06Q30/06;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 233000 安徽省蚌埠*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 分析 ugc 模糊 综合 评价 方法 | ||
1.一种基于情感分析的UGC模糊综合评价方法,其特征在于,包括以下步骤:
(1)建立电子商务商品评价指标结构模型
经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘宝购 物时关心的因素,建立电子商务商品评价指标结构模型;
(2)文本情感分析
(2.1)信息抽取
利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价意见,并且 累计关于商品的“好的评价信息”和“坏的评价信息”的数量;语句情感标签抽取方法是指将 一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行情感标签的 抽取与统计;
(2.2)情感极性判断
(2.2.1)初步判断
信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用hownet 情感词语集和同义词词林建立情感词典来直接确定其极性,“好”、“漂亮”相关褒义词语记 为”1”;如果在褒义词之前加有否定词,如“不好”、“不喜欢”记为”-1”;如果一般或者其它中 性的描述,就记为”0”;如果无法直接查找到情感词语的极性,则利用上下文关系进行判断, 如果消费者评论语句中出现转折词语,比如“尽管…还是…”,“可”,“但是”的词语出现时, 则在基本情感提取结果上减1;如果出现递进关系的词语,“不但、不仅、而且”的词语出现 时,在评论语句的基本情感基础上加1;
(2.2.2)进一步判断
情感描述性词语被副词修饰的情况下,情感极性强度会被加强,好的情感倾向在程度 副词的修饰下会更好,坏的情感倾向则会更坏,比如“很好、超符合、极其差”,当一个评论中 的情感描述词被程度副词修饰时,如果情感极性通过步骤(2.2.1)中的方法被判断为”1”, 则将其更改为”2”;如果情感极性通过步骤(2.2.1)中的方法被判断为”-1”,则将其更改 为”-2”;
评论信息的情感极性判断完成之后,会得到一个相对应的数值,有五种可能:2、1、0、- 1、-2,分别将这五种可能与五个等级相对应,如{2,1,0,-1,-2}={较好,好,一般,差,极 差};
(3)模糊综合评价
(3.1)模糊统计
①在每一次试验中都要确定指标集U中的固定元素Bi中的一个u0是否属于可变动的等 级集合;每一次试验中,指标集都必须属于一个确定清晰的集合,而每一个消费者对商品的 评价都可以看做一个试验,如:针对一条消费者评价,商品的质量情况属于五个等级中的哪 一个,必须清晰、明确;
②在每一条消费者评论中,u0是固定的,而评价等级A在随机变动;如果在所分析的n条 评论中,元素u0属于A的次数为m,则元素u0对A的隶属频率定义为:
当商品评论条数n足够大时,根据大数定律,元素u0的隶属频率总是稳定于某一数,这 个稳定的数即为元素u0对A的隶属度,模糊统计用来确定模糊评价方法的隶属度;
(3.2)模糊评价
(3.2.1)构建模糊评价指标
根据商品评价指标确定指标集,一级指标集记为U={U1U2…Um},其中i=1,2,..., m,表示有m个一级指标;二级指标记为Ui={ui1,ui2,…,uin},表示第i个一级指标有n个二级 指标;一级指标集为U={B1B2B3},二级指标集为B1={C1C2C3};
(3.2.2)确定评价集V={V1,V2,…,Vn}
每一个评价指标Ui有n个评价等级,淘宝评分系统用五颗星的评价方法,在这里用常见 的方法确定五个等级:{较好,好,一般,差,极差},评价等级与分数的对应关系为:{较好, 好,一般,差,极差}={5,4,3,2,1};
(3.2.3)确定评价指标权重
首先,统计商品的评论信息条数(n);然后,利用步骤(2)实现信息抽取;然后统计评论 中提及的商品情况(m)、物流情况(f)、服务情况(x);接着,分别计算这三个指标的评论条数 占总评论条数的百分比作为权重,具体权重计算方法为:商品自身情况的权重为m/(m+f+ x),物流情况权重为f/(m+f+x),服务情况权重为x/(m+f+x),同一条评论中同时提及多个商 品的指标,即(m+f+x)≠n;并且对商品评价信息提到的要素进行归类,在统计数量时,商品 情况+1;统计结束得到的权重要进行归一化处理,最后的结果作为模糊综合评价的各个指 标的权重,记为A={a1,a2,…,am},m表示指标的个数;
(3.2.4)确定模糊评价矩阵
在商品情况、物流情况,服务情况的指标下,计算每个评价等级所占的比例,得到以下m 个指标构成的模糊评价矩阵R
(3.2.5)计算综合评价值
模糊综合评价模型为:
其中bj表示被评级对象从整体上看对评价等级模糊子集隶属程度,A表示评价指标的 相关权重,R是模糊评价矩阵;
然后对B进行归一化处理,得到模糊综合评价集最后用的值确 定该商品的综合得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐勇,未经徐勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610131279.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:英语二级盲文转换方法及转换装置
- 下一篇:用于输送系统的上压轮