[发明专利]一种评论数据的处理方法及处理装置在审
申请号: | 201611091123.6 | 申请日: | 2016-12-01 |
公开(公告)号: | CN106776931A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 谭领城;李梦婷;李翔 | 申请(专利权)人: | 珠海市魅族科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 519000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 数据 处理 方法 装置 | ||
技术领域
本发明涉及数据处理和数据挖掘领域,具体涉及一种评论数据的处理方法及处理装置。
背景技术
随着信息技术的发展,互联网已经成为当今社会人们获取信息的重要渠道,互联网快捷、方便的特性,以及强大的交互能力,为人们交流思想、阐明观点、发表意见提供了新的平台,因此也产生了大量的评论数据,比如微博中的评论数据、电子商务中关于商品的评论数据等。评论数据通常带有人们的情感倾向,情感倾向可认为是主体对某一客体主观存在的内心喜恶,比如可以理解为人们对某客体表达自身观点所持的态度是支持还是反对,是正面情感还是负面情感。例如“赞美”与“表扬”为褒义词,表达正面情感,而“龌龊”与“丑陋”为贬义词,表达负面情感。对评论数据的情感倾向进行分类标记,可以方便对大量的评论数据进行分析,帮助企业、政府、消费者等更好的把握用户的偏好,从而对自己的产品或者工作上的改进产生良好的指导作用。
现有技术中,大多是基于情感词典或者分析评论语句的语法而得到评论语句的情感倾值,最后根据情感倾值判定评论语句的情感倾向。
但是,简单的基于情感词典或者评论语句的语法,忽略了网络语言灵活性的特点,对评论语句的情感倾向的判断不够准确。
发明内容
本发明提供一种评论数据的处理方法及处理装置,用于解决现有技术对评论语句的情感倾向的判断不够准确。
本发明实施例的一方面提供了一种评论数据的处理方法,包括:
获取情感倾向已知的样本评论语句;
计算所述样本评论语句的句向量;
利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练,得到情感分类器;
利用所述情感分类器对待测评论语句的情感倾向进行预测。
结合第一方面,在第一方面的第一种可能的实现方式中,所述情感倾向包括第一情感、第二情感和第三情感;
所述情感分类器包括第一情感模型、第二情感模型和第三情感模型,所述第一情感模型用于计算所述待测评论语句的情感倾向为第一情感的第一概率,所述第二情感模型用于计算所述待测评论语句的情感倾向为第二情感的第二概率,所述第三情感模型用于计算所述待测评论语句的情感倾向为第三情感的第三概率。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练得到所述第一情感模型,包括:
判断所述样本评论语句的情感倾向是否为第一情感;
若是,则将所述样本评论语句的句向量加入预建的所述第一情感模型的第一集合;
若否,则将所述样本评论语句的句向量加入预建的所述第一情感模型的第二集合;
利用所述第一集合和所述第二集合进行二分类训练建模,得到所述第一情感模型;
利用所述第一情感模型对待测评论语句的情感倾向进行预测包括:
利用所述第一情感模型计算所述待测评论语句的句向量属于所述第一情感模型的第一集合的概率。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,利用所述情感分类器对待测评论语句的情感倾向进行预测包括:
分别利用所述第一情感模型、所述第二情感模型和所述第三情感模型对所述待测评论语句的情感倾向进行预测,得到第一概率、第二概率和第三概率;
确定所述第一概率、所述第二概率和所述第三概率中取值最大的概率对应的情感模型为目标情感模型;
确定所述目标情感模型对应的情感倾向为所述待测评论语句的情感倾向。
结合第一方面、第一方面的第一种可能的实现方式、第一方面的第二种可能的实现方式和第一方面的第三种可能的实现方式之中任意一种,在第一方面的第四种可能的实现方式中,所述计算所述样本评论语句的句向量包括:
对所述样本评论语句进行分词,得到样本词集合;
利用基于Word2Vec的神经网络计算所述样本词集合中的样本词的词向量,得到所述样本评论语句对应的样本词向量集合;
计算所述样本词向量集合的中心向量,作为所述样本评论语句的句向量。
本发明实施例的第二方面提供了一种评论数据的处理装置,包括:
获取模块,用于获取情感倾向已知的样本评论语句;
计算模块,用于计算所述样本评论语句的句向量;
训练模块,用于利用所述样本评论语句的句向量与所述样本评论语句的情感倾向对基于学习的分类器进行训练,得到情感分类器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市魅族科技有限公司,未经珠海市魅族科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611091123.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置