[发明专利]一种自动分类社交网络用户评论数据的方法有效
申请号: | 201911329160.X | 申请日: | 2019-12-20 |
公开(公告)号: | CN111078888B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 郑文锋;杨波;王爽;刘珊;曾庆川 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/9536;G06Q50/00 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 分类 社交 网络 用户 评论 数据 方法 | ||
本发明公开了一种自动分类社交网络用户评论数据的方法,通过在网络社交平台中采集评论数据,进行预处理后生成一个包含关键词的文本特征词项集合;再将包含关键词的文本特征词项集合与预先生成的类别特征关键词之间建立映射,判断文本特征词项集合中的词项是否出现在所属类中类别特征关键词库中,从而计算出文本特征词项集合中每一个词项与所属类别特征关键词库的特征值,然后生成特征向量,利用预先训练得到的分类模型进行分类,从而完成该评论数据的自动分类;具有实时性、分类效果好,且包含了更多的有效信息。
技术领域
本发明属于自然语言处理技术领域,更为具体地讲,涉及一种自动分类社交网络用户评论数据的方法。
背景技术
随着计算机尤其是智能手机在我国的普遍发展,互联网已经成为绝大多数人们获取各种信息的主要途径。知乎、微博作为其中一种信息类互联网产品,提供了一种供用户使用、参与的网络社交平台。人们可以在网络社交平台中获取各类信息,并通过关注、评论、点赞等不同方式参与。随着多年的发展,知乎、微博已经多次证明它具有将社会、娱乐、新闻类等信息快速发酵、快速传播、然后达到大众普遍关注的一种能力。而其中,用户往往会通过评论的方式在网络社交事件参与中发表个人看法或言论,其用户评论往往具有很大的研究和参考价值。
对文本数据进行自动化分类是文本数据挖掘、自然语言处理等人工智能技术的重要应用领域,其主要功能是把以数字化形式存储的非结构化文本数据,通过自然语言处理技术、文本数据挖掘技术,自动按照事先组织好的与具体业务相关的类别进行分类。随着信息时代技术的不断发展,对文本数据进行自动化分类是提高企业生产效率和竞争优势的一种重要技术措施。
由于用户在关注网络社交事件过程中,往往会产生个人倾向性情感,在参与中发表的评论数据亦带有这种具备自我倾向性的情感。比如:对某个发生的争议事件的看法,或者是对某部影片的影评、对某款手机的用户体验等。对这些用户的评论数据进行分析,能够识别出现或者隐含在其中的情感信息,并发现大多数用户对该网络社交事件的一种舆情信息。基于此现象,对用户评论数据的分类也可以是对评论数据带有的情感进行分类。情感文本是主观性文本,它是与主要陈述事实的客观性文本相对应的对于实体、事件的一种主观性表达意见或者评论文本。情感文本自动化分类是对文本数据中的情感进行多层级分类,挖掘文本数据潜在的情感表达含义,进而可以发掘用户的兴趣和需求,对事件舆情的掌握、相关产品的丰富都有很重要的意义。具体讲,由于知乎、微博上充斥了各类并且大量的实时性的新闻信息,人们在使用知乎或者微博产品时,若想要看到其他人对某一网络社交事件的评价或反响时,由于当前缺乏这种有效解决对网络社交平台中的用户评论数据实行自动化分类分析的方法和系统,并在传统新闻媒体参与之前,用户只能通过不停的刷新其他用户评论来达到想要的目的。这种纯靠人力达到目的的方式既浪费用户时间也并不能保证取得良好的效果。
目前缺少实际有效的解决网络社交平台中对中文评论数据进行自动分类分析的方法和系统,因此找到一种针对中文的基于自动文本分类技术的网络社交事件用户评论数据自动分类分析方法与系统,在最大程度上减轻数据处理人员的工作量并提高产品服务质量就是一个显得迫切的任务。
发明内容
本发明的目的在于克服现有技术的不足,提供一种自动分类社交网络用户评论数据的方法,通过对网络社交事件用户评论数据自动分类,便能方便用户快速浏览设计网络,增强用户的体验,同时也能方便平台更好的了解大众看法。
为实现上述发明目的,本发明一种自动分类社交网络用户评论数据的方法,其特征在于,包括以下步骤:
(1)、设置分类类别
设置朴素贝叶斯分类模型的分类类别数为N;
(2)、数据采集
采集社交网络中某一事件主题下所有用户的评论数据;
(3)、数据预处理
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911329160.X/2.html,转载请声明来源钻瓜专利网。