[发明专利]一种文本倾向性分析方法及基于该方法的商品评论倾向判别器在审
申请号: | 201310355704.6 | 申请日: | 2013-08-13 |
公开(公告)号: | CN103455562A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 董丽丽;赵繁荣;张翔;王茹 | 申请(专利权)人: | 西安建筑科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710055 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本倾向性分析方法包括步骤:对评论文本进行预处理;识别中文句法的依存关系结构;计算情感词的上下文极性值;完成评价对象和评价词的二元组抽取,确定评价对象间的从属关系;对情感词倾向值加权求和得到句子倾向值,实现句子级倾向性判别;通过句子级极性值的正负,判别评论情感的褒贬倾向;根据极性绝对值大小,判别评论褒贬情感的强弱。商品评论倾向判别器包括:采集模块、预处理模块、句法分析模块、情感计算引擎、二元组挖掘引擎、上下文控制器和情感判别器。本发明结合组合情感词典并将领域本体加入文本倾向性分析,提高了情感词极性计算与<评价对象,评价词>二元组抽取的准确率,实现了对论坛商品评论的倾向性分析。 | ||
搜索关键词: | 一种 文本 倾向性 分析 方法 基于 商品 评论 倾向 判别 | ||
【主权项】:
一种文本倾向性分析方法,其特征在于,包括以下步骤: (1)对评论文本进行预处理,通过采集模块中相应的爬虫工具对目标网页的爬取,并在预处理模块中,针对评论内容的HTML标签进行抽取、去噪,以筛选出有用的评论文本; (2)针对预处理后的评论文本,句法分析模块经句法分析器识别出中文句法的依存关系结构; (3)情感计算引擎根据情感词典计算出情感词的上下文极性值; (4)将领域本体引入到SBV极性传递算法当中,二元组挖掘引擎根据本体知识,完成评价对象和评价词的二元组抽取,并确定评价对象间的从属关系; (5)通过对情感词倾向值加权求和得到句子倾向值,实现句子级倾向性判别; (6)通过句子级极性值的正负,判别评论情感的褒贬倾向;根据极性绝对值大小,判别评论褒贬情感的强弱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安建筑科技大学,未经西安建筑科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310355704.6/,转载请声明来源钻瓜专利网。
- 上一篇:通过搜索引擎获取通信联系人的方法及终端
- 下一篇:具有交互功能的投影系统