[发明专利]一种面向产品属性的观点倾向性分析方法及系统在审
申请号: | 201910480857.0 | 申请日: | 2019-06-04 |
公开(公告)号: | CN110362817A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 刘全超;胡玥 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/33;G06F16/35;G06N3/08 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品属性 倾向性分析 观点信息 检索系统 产品评论 空间信息 语义表示 倾向性 句子 注意力 词语 互联网产品 技术实现 技术手段 评论数据 文本序列 影响产品 用户兴趣 语义信息 分类器 数据集 嵌入 网络 查询 学习 | ||
本发明公开了一种面向产品属性的观点倾向性分析方法及系统。该方法主要包括:面向互联网产品评论数据集的预训练词嵌入模型;生成依赖产品属性的深层语义表示;基于词语空间信息和交互式注意力网络的识别影响产品属性观点倾向性的语义信息;面向产品属性的句子级观点倾向性分类器实现。另外实现了基于上述技术的面向产品评论的观点信息检索系统。本发明运用深度学习技术手段设计了依赖产品属性的深层语义表示,运用文本序列中词语的空间信息和交互式注意力网络,实现了面向产品属性的句子级观点倾向性分析方法,并运用上述相关技术实现了面向产品评论数据集的产品属性观点信息检索系统,提高了用户兴趣点(产品及产品属性)的观点信息精准查询。
技术领域
本发明属于信息技术领域,具体涉及一种面向产品属性的观点倾向性分析方法及系统。
背景技术
互联网上用户产生的数据依据文本内容大致可以分为事实和观点两种类型。事实型文本主要是指对于某实体或事件的客观性描述,例如常见的操作指南、产品说明书等。一般事实型文本只是陈述相关内容,不会含有主观的情感或观点。观点型文本主要是指人们对某实体、实体属性或事件的主观感受,通过这种主观的表达以达到情感的表达与流露,例如人们针对某种产品或某种产品属性的看法与态度等。观点型文本有两个比较突出的特点:非结构化数据和丰富的信息量。本发明是面向产品评论数据集中产品属性的细粒度观点倾向性分析方法研究。
观点倾向性分析,又叫情感倾向性分析,其任务大致可以分为两种:一种是主、客观信息的二元分类;另一种是主观信息的情感分类,包括最常见的正向情感(褒)、负向情感(贬)二元分类,以及更加细致的多元分类。客观性信息强调的是一种不带有情感色彩的对个人、事物或事件的一种客观性描述,而主观性信息主要描述作者对事件、事物、人物等的个人(或群体、组织等)想法或看法。在Web2.0时代,互联网存在大量的客观性信息和主观性信息,尤其在社交网络中充斥着海量的用以表达喜、怒、哀、乐的主观性信息。
观点倾向性分析按照处理文本的粒度不同,大致可以分为词语级观点倾向性分析、短语级观点倾向性分析、句子级观点倾向性分析、篇章级观点倾向性分析以及多篇章级整体倾向性预测几个研究层次。对词语级的观点倾向性分析研究是文本观点倾向性分析的前提。具有观点倾向的词语以名词、动词和形容词为主,也包括人名、机构名、产品名、事件名等命名实体。目前,词语的观点倾向性分析主要有三种方法:由已有的电子词典或词语知识库扩展而成、无监督机器学习法以及基于人工标注语料库的学习方法。词语级的观点倾向性分析处理对象是单独的词语,而句子级的观点倾向性分析处理对象是在特定上下文中出现的语句,其任务就是对句子中的各种主观性信息进行观点倾向的判定。如果说句子是“点”,那么由句子组成的篇章是“线”,而由多篇文章组成的语料库就是“面”。“点”、“线”、“面”的观点倾向性分析是存在内在关系的,在句子观点倾向分析的基础上,可以很方便地进行篇章的观点倾向分析,甚至可以得到海量信息的整体倾向性态势。篇章级的观点倾向性分析就是要从整体上判断某个文档的观点倾向性,即褒贬态度。而多篇章级的整体倾向性预测则是针对海量数据而言的,其主要任务就是从不同信息源抽取出的、针对某个话题的观点倾向性信息进行集成和分析,挖掘出态度的特点和走势。
观点倾向性分析归纳起来主要有三类:基于规则的观点倾向性分析、基于统计的观点倾向性分析以及规则和统计相结合的观点倾向性分析法。在基于规则的观点倾向性分析法中,大多数前期工作都离不开构造情感词典,而这些情感词典大都是由已存在的词典或词语知识库扩展加工而成。基于规则的观点倾向性分析法主要是对文本进行预处理,包括分词、词性标注、依存句法分析等,然后针对情感词语制定一些规则来对文档进行观点倾向性判定。基于统计的观点倾向性分析法主要是发掘文本描述的结构特征和词汇信息,结合贝叶斯、最大熵、支持向量机等统计模型分类器进行观点倾向性判定。规则与统计相结合的观点倾向性分析法是将规则法的优势与统计法的优势相结合,达到文档观点倾向性分析的最佳效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910480857.0/2.html,转载请声明来源钻瓜专利网。