[发明专利]用于与领域无关的方面级别情绪检测的系统和方法在审
申请号: | 201880043379.0 | 申请日: | 2018-06-26 |
公开(公告)号: | CN110799981A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 冯哲;赵林;徐魁;贺一帆 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/35;G06N5/00;G06N20/00;G06Q30/02;G06Q50/00 |
代理公司: | 72001 中国专利代理(香港)有限公司 | 代理人: | 黄涛;刘春元 |
地址: | 德国斯*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 修辞结构 训练数据 评论 关联 概率 解析 训练分类器 负面情绪 情绪分析 注释数据 情绪 跨距 自动化 | ||
1.一种用于自动化情绪分析的方法,包括:
利用服务器中的网络接口设备从第一领域接收第一多个评论,第一多个评论中的每个评论与注释数据相关联,所述注释数据识别被包括在所述第一多个评论中的多个情绪和多个方面;利用服务器中的处理器解析来自第一领域的第一多个评论,以生成第一多个修辞结构树,第一多个修辞结构树中的每个修辞结构树对应于第一多个评论中的一个评论,并且第一多个修辞结构树中的每个修辞结构树包括与预定关系相关联的至少一个跨距;
利用服务器中的处理器从第一多个修辞结构树提取多个修辞规则,每个修辞规则包括从第一多个修辞结构树中的至少一个修辞结构树中的至少一个跨距提取的与概率相关联的路径,所述概率是所述路径基于所述注释数据与正面或负面情绪对应的概率;
利用服务器中的网络接口设备从与第一领域不同的第二领域接收第二多个评论,第二多个评论不包括注释数据;
利用服务器中的处理器解析来自第二领域的第二多个评论,以生成第二多个修辞结构树,第二多个修辞结构树中的每个修辞结构树对应于第二多个评论中的一个评论,第二多个修辞结构树中的每个修辞结构树包括与所述预定关系相关联的至少一个跨距;
响应于从包括第二多个评论中的评论中的至少一个方面的修辞结构树提取的路径与所述修辞规则的所述路径匹配,利用服务器中的处理器生成训练数据,所述训练数据把第二多个评论中的评论中的所述至少一个方面与和所述多个修辞规则中的修辞规则相关联的情绪相关联;以及
利用服务器中的处理器使用第二多个评论和所述训练数据训练分类器,以识别来自第二领域的评论中的情绪。
2.根据权利要求1所述的方法,提取多个修辞规则还包括:
利用服务器中的处理器从第一多个修辞结构树提取多个路径,所述多个路径中的每个路径包括包含方面的至少一个跨距。
3.根据权利要求1所述的方法,还包括:
利用服务器中的网络接口设备从第二领域接收第三多个评论;
利用服务器中的处理器基于分类器的输出识别针对被包括在第三多个评论内的至少一个方面的多个情绪;以及
利用服务器中的处理器生成包括方面级别情绪报告的输出,所述方面级别情绪报告识别针对第三多个评论中的所述至少一个方面的聚合情绪级别。
4.根据权利要求3所述的方法,还包括:
利用服务器中的处理器解析来自第二领域的第三多个评论以生成第三多个修辞结构树,第三多个修辞结构树中的每个修辞结构树与第三多个评论中的一个评论对应,第三多个修辞结构树中的每个修辞结构树包括与所述预定关系相关联的至少一个跨距;以及
利用服务器中的处理器过滤分类器的输出以去除与第三多个评论中的一个评论中的一方面相对应的情绪,所述第三多个评论中的一个评论中的一方面具有与具有小于预定阈值的针对所述一个评论所识别的所述情绪的概率的修辞规则相对应的修辞树中的路径。
5.根据权利要求1所述的方法,所述解析还包括:
利用服务器中的处理器把针对所述多个修辞结构树中的修辞结构树中的至少一个跨距的预定关系识别为联合关系、让步关系、详细阐述关系或使能关系。
6.根据权利要求4所述的方法,所述解析还包括:
识别所述修辞结构树中的所述至少一个跨距中的联合关系,所述至少一个跨距还包括至少两个跨距。
7.根据权利要求1所述的方法,其中,针对第二领域的分类器是最大熵分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880043379.0/1.html,转载请声明来源钻瓜专利网。