[发明专利]一种基于情感分析的UGC模糊综合评价方法在审
申请号: | 201610131279.6 | 申请日: | 2016-03-08 |
公开(公告)号: | CN105718446A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 徐勇;张慧;李东勤;陈亮;梁后军;魏苏林 | 申请(专利权)人: | 徐勇 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N7/02;G06Q30/06;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 233000 安徽省蚌埠*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于情感分析的UGC模糊综合评价方法,在分析、研究以上模糊综合评价方法各自优缺点的基础上,本发明将情感标签的抽取、情感极性的判断、模糊统计等方法引入到用户生成内容的模糊综合评价,首先,利用情感抽取、情感极性判断的方法,将相关用户生成的评价信息情感分为若干评价等级;然后,通过模糊统计方法确定模糊综合评价矩阵;最后,构建综合评价模型FCE,由于因素集、指标权重和模糊评价矩阵的确定,是模糊综合评价方法的重要环节。还考虑相关因素集被提及的次数,从而能够更加客观地确定评价指标模型中因素的指标权重。模型中的指标权重和模糊评价矩阵可以用机器学习的方法得到,计算途径方便可靠。 | ||
搜索关键词: | 一种 基于 情感 分析 ugc 模糊 综合 评价 方法 | ||
【主权项】:
一种基于情感分析的UGC模糊综合评价方法,其特征在于,包括以下步骤:(1)建立电子商务商品评价指标结构模型经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘宝购物时关心的因素,建立电子商务商品评价指标结构模型;(2)文本情感分析(2.1)信息抽取利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价意见,并且累计关于商品的“好的评价信息”和“坏的评价信息”的数量;语句情感标签抽取方法是指将一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行情感标签的抽取与统计;(2.2)情感极性判断(2.2.1)初步判断信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用hownet情感词语集和同义词词林建立情感词典来直接确定其极性,“好”、“漂亮”相关褒义词语记为”1”;如果在褒义词之前加有否定词,如“不好”、“不喜欢”记为”‑1”;如果一般或者其它中性的描述,就记为”0”;如果无法直接查找到情感词语的极性,则利用上下文关系进行判断,如果消费者评论语句中出现转折词语,比如“尽管…还是…”,“可”,“但是”的词语出现时,则在基本情感提取结果上减1;如果出现递进关系的词语,“不但、不仅、而且”的词语出现时,在评论语句的基本情感基础上加1;(2.2.2)进一步判断情感描述性词语被副词修饰的情况下,情感极性强度会被加强,好的情感倾向在程度副词的修饰下会更好,坏的情感倾向则会更坏,比如“很好、超符合、极其差”,当一个评论中的情感描述词被程度副词修饰时,如果情感极性通过步骤(2.2.1)中的方法被判断为”1”,则将其更改为”2”;如果情感极性通过步骤(2.2.1)中的方法被判断为”‑1”,则将其更改为”‑2”;评论信息的情感极性判断完成之后,会得到一个相对应的数值,有五种可能:2、1、0、‑1、‑2,分别将这五种可能与五个等级相对应,如{2,1,0,‑1,‑2}={较好,好,一般,差,极差};(3)模糊综合评价(3.1)模糊统计①在每一次试验中都要确定指标集U中的固定元素Bi中的一个u0是否属于可变动的等级集合;每一次试验中,指标集都必须属于一个确定清晰的集合,而每一个消费者对商品的评价都可以看做一个试验,如:针对一条消费者评价,商品的质量情况属于五个等级中的哪一个,必须清晰、明确;②在每一条消费者评论中,u0是固定的,而评价等级A在随机变动;如果在所分析的n条评论中,元素u0属于A的次数为m,则元素u0对A的隶属频率定义为:当商品评论条数n足够大时,根据大数定律,元素u0的隶属频率总是稳定于某一数,这个稳定的数即为元素u0对A的隶属度,模糊统计用来确定模糊评价方法的隶属度;(3.2)模糊评价(3.2.1)构建模糊评价指标根据商品评价指标确定指标集,一级指标集记为U={U1 U2 … Um},其中i=1,2,...,m,表示有m个一级指标;二级指标记为Ui={ui1,ui2,…,uin},表示第i个一级指标有n个二级指标;一级指标集为U={B1 B2 B3},二级指标集为B1={C1 C2 C3};(3.2.2)确定评价集V={V1,V2,…,Vn}每一个评价指标Ui有n个评价等级,淘宝评分系统用五颗星的评价方法,在这里用常见的方法确定五个等级:{较好,好,一般,差,极差},评价等级与分数的对应关系为:{较好,好,一般,差,极差}={5,4,3,2,1};(3.2.3)确定评价指标权重首先,统计商品的评论信息条数(n);然后,利用步骤(2)实现信息抽取;然后统计评论中提及的商品情况(m)、物流情况(f)、服务情况(x);接着,分别计算这三个指标的评论条数占总评论条数的百分比作为权重,具体权重计算方法为:商品自身情况的权重为m/(m+f+x),物流情况权重为f/(m+f+x),服务情况权重为x/(m+f+x),同一条评论中同时提及多个商品的指标,即(m+f+x)≠n;并且对商品评价信息提到的要素进行归类,在统计数量时,商品情况+1;统计结束得到的权重要进行归一化处理,最后的结果作为模糊综合评价的各个指标的权重,记为A={a1,a2,…,am},m表示指标的个数;(3.2.4)确定模糊评价矩阵在商品情况、物流情况,服务情况的指标下,计算每个评价等级所占的比例,得到以下m个指标构成的模糊评价矩阵R (3.2.5)计算综合评价值模糊综合评价模型为:其中bj表示被评级对象从整体上看对评价等级模糊子集隶属程度,A表示评价指标的相关权重,R是模糊评价矩阵; 然后对B进行归一化处理,得到模糊综合评价集最后用的值确定该商品的综合得分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐勇,未经徐勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610131279.6/,转载请声明来源钻瓜专利网。
- 上一篇:英语二级盲文转换方法及转换装置
- 下一篇:用于输送系统的上压轮