[发明专利]基于大量样本数据的情感评价方法及装置有效
申请号: | 201710245355.0 | 申请日: | 2017-04-14 |
公开(公告)号: | CN108733675B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 王九硕;张丹;于晓明;蔡慧慧;于琳琳 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 大量 样本 数据 情感 评价 方法 装置 | ||
本发明提供了一种基于大量样本数据的情感评价方法和装置,其中,基于大量样本数据的情感评价方法包括:确定样本信息中任意指定领域产品的特征信息;根据特征信息和预设的样本信息训练模型,生成训练数据;根据训练数据和预设的基于增量的文本分类模型,生成不同时间段内的任意指定领域产品的评价信息;采用word2vec对评价信息进行向量化处理,以生成待评价的向量矩阵;将待评价的向量矩阵输入卷积神经网络,以根据卷积神经网络的输出结果,得到评价信息的情感值。通过本发明的技术方案,提高了用户获取特定领域产品评价信息感情值的准确性和有效性,根据获取到的不同产品的评价分析结果,用户能够更好地选择产品或者制定更合理的产品营销手段。
技术领域
本发明涉及情感评价领域,具体而言,涉及一种基于大量样本数据的情感评价方法及一种基于大量样本数据的情感评价装置。
背景技术
随着社交网络的飞速发展,越来越多的人利用社交网络平台发布大量的信息,无论是国家大事,还是个人的日常生活信息,都会通过这一平台进行传递。根据2015年6月《中国互联网络发展状况统计报告》,网民规模达6.68亿。其中,最为典型的是新浪微博,其月活跃人数已经超过2亿,并且涉及生活的方方面面,包括不同领域的产品评价信息。因此,大量的微博数据为我们研究基于微博特定领域产品的评价方法,提供了数据支持。
情感分析在自然语言处理中是一个热门的话题,目前,人们通常关注于特定领域的情感分类,相关技术中,由于不同领域的产品评价信息,都具有不同的情感特征,一方面,仅通过提取产品评价信息中的情感词,不能有效地确定其情感类别,另一方面,由于微博短小精悍的特征,有效提取产品信息特征也是一个难点。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提出了一种基于大量样本数据的情感评价方法。
本发明的另一个目的在于提出了一种基于大量样本数据的情感评价装置。
为了实现上述目的,根据本发明第一方面的技术方案,提出了一种基于大量样本数据的情感评价方法,包括:确定样本信息中任意指定领域产品的特征信息;根据特征信息和预设的样本信息训练模型,生成训练数据;根据训练数据和预设的基于增量的文本分类模型,生成不同时间段内的任意指定领域产品的评价信息;采用word2vec对评价信息进行向量化处理,以生成待评价的向量矩阵;将待评价的向量矩阵输入卷积神经网络,以根据卷积神经网络的输出结果,得到评价信息的情感值。
根据本发明技术方案的基于大量样本数据的情感评价方法,在样本信息中获得指定领域产品评价信息的情感值,通过确定样本信息中任意指定领域产品的特征信息,对特征信息按照预设的样本信息训练模型,生成训练数据;并对训练数据按照预设的基于增量的文本分类模型,生成不同时间段内的任意指定领域产品的评价信息;再采用word2vec(文本深度表示模型)对评价信息进行向量化处理,生成待评价的向量矩阵;将待评价的向量矩阵输入卷积神经网络,以根据卷积神经网络的输出结果,最终得到评价信息的情感值。提高了用户获取特定领域产品评价信息感情值的准确性和有效性,根据获取到的不同产品的评价分析结果,用户能够更好地选择产品或者制定更合理的产品营销手段。
根据本发明技术方案的基于大量样本数据的情感评价方法,还可以具有如下技术特征:
在上述技术方案中,优选地,在确定样本信息中任意指定领域产品的特征信息前,还包括:预设指定领域产品的关键词信息,以根据关键词信息确定样本信息,其中,关键词信息包括产品名称、产品评价数据范围,产品评价时间范围。
在该技术方案中,为了确保确定样本信息中任意指定领域产品的特征信息及后续方案的顺利实施,需要事先确定样本信息,即通过预设指定领域产品的关键词信息,以根据关键词来确定样本信息。
其中,关键词信息包括但不限于产品名称、产品评价数据范围,产品评价时间范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710245355.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种A2L文件合并方法及装置
- 下一篇:视频缩略图的提取方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置