[发明专利]用于与领域无关的方面级别情绪检测的系统和方法在审
申请号: | 201880043379.0 | 申请日: | 2018-06-26 |
公开(公告)号: | CN110799981A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 冯哲;赵林;徐魁;贺一帆 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/35;G06N5/00;G06N20/00;G06Q30/02;G06Q50/00 |
代理公司: | 72001 中国专利代理(香港)有限公司 | 代理人: | 黄涛;刘春元 |
地址: | 德国斯*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 修辞结构 训练数据 评论 关联 概率 解析 训练分类器 负面情绪 情绪分析 注释数据 情绪 跨距 自动化 | ||
一种用于自动化的基于方面的情绪分析的方法包括:解析来自第一领域的评论以生成修辞结构树并且从所述修辞结构树提取修辞规则,每个修辞规则包括从修辞结构树中的至少一个修辞结构树中的至少一个跨距提取的与概率相关联的路径,所述概率是基于注释数据所述路径与正面或负面情绪对应的概率。所述方法还包括:解析来自第二领域的评论,以生成第二多个修辞结构树;生成训练数据,所述训练数据把来自第二领域的评论中的至少一个方面与和所述多个修辞规则中的修辞规则相关联的情绪相关联;以及使用第二多个评论和所述训练数据训练分类器,以识别来自第二领域的评论中的情绪。
优先权声明
本申请要求美国临时申请编号62/526,398的权益,该美国临时申请的标题为“SystemAnd Method For Domain-Independent Aspect Level Sentiment Detection”并于2017年6月29日提交,其全部内容通过引用明确地并入本文。
技术领域
本公开一般地涉及自然语言处理(NLP)、情绪分析和人机交互(HMI)的领域,并且更具体地涉及用于针对领域自动生成经训练的情绪分析模型而无需手动注释该领域中的训练集的方法和系统。
背景技术
自动化情绪分析系统使计算机化系统能够处理大量人为生成的信息,诸如在线产品评论和社交媒体帖子,以便理解消费者需求,草拟营销策略并识别潜在的改进领域。对于方面级别情绪分析尤其如此,方面级别情绪分析检测用户对产品或服务的每个方面的意见。与评论级别情绪分析相比,方面级别系统可以为市场分析提供更详细的信息。例如:评论级别情绪分析系统可以从在线用户评论中总结出用户喜欢特定的钻孔机,但是方面级别系统将报告用户因为钻孔机功能强大而对钻孔机表达正面的情绪,但进一步建议如果钻孔机具有更长的电池寿命,则可以改善用户的情绪。
在实践中,方面级别情绪分析系统通常首先利用包含产品的一般方面(例如,功率、价格、电池等)的预定义本体来检测用户评论中的各个方面,然后尝试预测评论者对这些方面的情绪极性。术语“情绪极性”指示评论者对产品的特定方面具有“正面”情绪,“正面”情绪指示赞成该产品的偏爱,而负面极性指示抵触该产品的方面的偏爱。在方面情绪分析中,单个评论者可以对产品的一些方面表达具有正面极性的情绪,同时对产品的其他方面表达具有负面极性的情绪。
尽管本领域已知一些形式的方面情绪分析,但是现有系统需要大量的人力来对特定领域中的产品的大量评论进行分类或“注释”以使得机器学习过程能够产生情绪分析模型,情绪分析模型然后被用于自动化方面级别情绪分析系统。在现有技术中,必须对适用于特定领域的特定训练数据集重复手动注释过程。例如,针对一个领域的训练数据集包括手动注释的数据,该手动注释的数据包含用户对餐厅的情绪,该数据使机器学习过程能够生成情绪分析模型,以评估对其他餐厅评论的特定方面的正面或负面情绪。但是,为了生成不同领域(诸如消费电子产品)中的另一个情绪分析模型,与餐厅领域相关的经注释的训练数据不提供产生用于识别对消费电子产品的情绪的有用方面级别模型的相关信息。相反,必须将相同的手动注释过程应用于与消费电子产品领域相关的大的评论集,以提供训练数据来生成针对消费电子产品领域的有用情绪分析模型。鉴于现有技术的这些缺点,对情绪分析系统和方法进行改进以减少用于生成经训练的情绪分析模型的人类注释需求将是有益的。
发明内容
本公开描述了一种用于跨领域以高精度检测方面级别用户意见的计算系统和方法。该系统从收集来自web的用户评论的收集部件以及关于已知领域的情绪分类器开始。然后,该系统从所述已知领域提取与领域无关的修辞结构规则,并且这些规则可以被应用于新领域以自动训练方面级别情绪检测系统。经训练的系统的输出再次由修辞结构规则进行过滤以实现高精度。最终系统可用于为任何领域生成细粒度的方面级别情绪报告,而无需像现有技术中所需的那样需要人类用户进行广泛的领域专用的注释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880043379.0/2.html,转载请声明来源钻瓜专利网。