[发明专利]互联网信息分类方法和系统有效
申请号: | 201010268215.3 | 申请日: | 2010-08-30 |
公开(公告)号: | CN102385579B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 张鹏;马尧 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郑光 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词库 预置 分类 互联网信息 分词 匹配 计算机技术领域 预置关键词库 方式获取 分词模块 匹配模块 统计结果 用户评论 预存储 评论 存储 统计 | ||
本发明提出了一种互联网信息分类方法和系统,属于计算机技术领域。本发明实施例的系统包括:分词模块、预置关键词库模块、匹配模块。方法包括:获取用户输入的评论,并对所述评论进行分词以获取关键词;将所述关键词与预置的关键词库进行匹配,以获取每一关键词对应的情感值;该预置的关键词库存储至少两个分类的关键词,所述每一分类中分别预存储有至少一个关键词,以及该关键词对应的情感值;根据每一关键词对应的情感值获得所述评价的情感值。本发明实施例可以通过预置的关键词库及关键词对应的情感值,获取通过分词并匹配的方式获取用户评论对应的情感值。这样相比较现有技术中人工统计的方式,统计结果更加精确且效率高。
技术领域
本发明涉及计算机技术领域,特别涉及一种互联网信息分类方法和系统。
背景技术
随着互联网技术的发展以及网络的普及,越来越的网络用户不仅满足于简单的获取资讯,而希望参与到其中,因此对互联网发布的文章进行评论的功能应运而生。对文章进行评论是指,浏览新闻、博客等互联网上发送的文章的用户可以通过输入一段文字,以发表自己对文章的意见。中文博大精深,根据《第一届中国情感计算及智能交互学术会议》2003年第1卷中公开的许小颖等的论文《汉语情感系统中情感划分的研究》中将中文的分成8类型,33个子类型,即如下表所示:
类型 子类型 喜 喜悦,激动,自信,安心,满足 爱 喜爱,同情,敬佩,赞美,感动,信任,希望,谅解,感激,鼓励 怒 愤怒 哀 愁闷,悲伤,失望,后悔,羞疚,委屈,否定 恶 不喜欢,烦厌,急躁,嫉妒,责备,鄙视,疑问 惧 慌惧 惊 骇惊 叹 感叹
表1
而在用户发表的评论中包含了用户阅读完该文章后的感觉和心情。以腾讯新闻为例,每天仅位于评论排行榜前二十位的用户评论就多达五万条以上。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010268215.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种减震门扣
- 下一篇:多通道小封装收发器及组装方法