[发明专利]基于评价对象强化和带约束标签嵌入的方面类别检测系统及方法有效

专利信息
申请号: 202010374312.4 申请日: 2020-05-06
公开(公告)号: CN111581981B 公开(公告)日: 2022-03-08
发明(设计)人: 饶元;梁宏伟;贺龙;吴连伟 申请(专利权)人: 西安交通大学
主分类号: G06F40/30 分类号: G06F40/30;G06F40/205;G06F16/35;G06Q30/02;G06N3/04;G06N3/08
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 朱海临
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 评价 对象 强化 约束 标签 嵌入 方面 类别 检测 系统 方法
【说明书】:

发明公开了一种基于评价对象强化和带约束标签嵌入的方面类别检测系统及方法,通过多任务的方式引入评价对象信息强化方面类别检测特征、带约束的标签嵌入机制以及多种注意力机制相结合的方式,实现了对商品评论的方面类别检测。本发明将句子中的实体词作为外部信息,通过评价对象抽取任务融入到模型中来。并设计了相应的门控机制让实体词信息针对性的辅助方面类别检测任务。其次,本发明通过为标签嵌入增加约束,提高了各个主题标签之间的区分度。同时,本发明通过不同类型的注意力机制对不同类型的语义特征分别进行提取,从而解决了传统单一注意力机制下特征提取不充分的问题。

【技术领域】

本发明属于电子信息技术领域,涉及一种基于评价对象强化和带约束标签嵌入的方面类别检测系统及方法。

【背景技术】

随着互联网与电子商务的快速发展,人们越来越多地通过互联网进行在线购物、订餐、预定酒店等。人们经常会在购物完成后在商品的评论区域发表自己对于商品的看法和建议,这些商品评论对于消费者和企业都具有重要意义。对于消费者而言,这些商品评论是消费者了解产品性能的重要渠道,会对消费者的购买决策产生直接影响。对于生产产品的企业,商品评论在企业进行产品改进、新功能设计、竞品分析等方面具有重要意义。但是,商品评论的数量是十分惊的,就某一单个商品而言,不同电商网站、微博、论坛关于该产品的评论可多达几十万条。对于一些热门商品,其评论数量更是无法想象。不管对于企业还是消费者,如何从评论中找到真正有用的信息,更进一步的如何更准确的将这些信息所反映出的问题归类细化成为一个巨大的难题。

评论中往往会从不同的角度去描述对应的商品,以评论“收到新手机很开心,手机外观非常好看,但在充电的时候电池会发烫。”为例,该评论分别对手机的外观和电池这两个方面进行了描述。不同用户或企业可能想针对性地去了解某个产品的某个方面,如:某款手机的电池怎么样。那么就需要将和手机电池相关的评论都找出来,从而对这些评论进行进一步的分析。这一任务就是观点挖掘中的一项重要的研究任务:方面类别检测任务。

目前的方面类别检测方法主要分为两种:基于机器学习的方法和基于深度学习的方法。基于机器学习的方法通常是对商品评论中每个方面类别构建一个二分类机器学习模型,利用训练数据训练出多个方面类别检测模型对商品评论进行预测。其中,SVM,最大熵,逻辑回归是方面类别检测中最常用的机器学习模型。基于机器学习算法的分类问题研究的优点在于建模能力强,特征可解释,因此在分类问题中会获得相对稳定的效果。但标签数量的增多会导致模型训练过程非常耗时,很多特征需要手工构建,且基于启发式的贪心策略特征组合过程中,试验次数不可估量。基于深度学习的方法往往将该任务看成是一个多标签分类问题。相比于机器学习方法,基于深度学习的方法虽然可以避免很多繁琐的人工特征的构建和筛选工作,但由于绝大部分商品评论都是简短的一句话;其中,包含的信息量比较小,深度学习模型很难像机器学习模型那样准确地提取到句子的方面类别特征。因此,很多现有模型通过引入词典、知识库等外部信息来辅助模型更好的识别出句子的方面类别特征。但现有模型在引入外部知识的过程中缺乏针对性,仅仅是将外部知识作为辅助信息融合进来,未能对外部知识进行筛选从而把真正有利于方面类别检测的信息融入进来。另外,标签嵌入在很多自然语言处理任务中已经被证实标签本身具有主题代表作用,但就目前的研究来看还没有将标签嵌入应用到方面类别检测中来,同时以往的标签嵌入往往没有考虑到各个标签之间的区分度。最后,注意力机制被广泛运用于方面类别检测任务,但现有的注意力机制往往只是单方面的注意力机制。这样的注意力机制往往将所有类型的特征都通过统一的注意力机制进行筛选,无法兼顾不同类别的特征,所以增加了注意力机制中含有噪声的概率。

综上,现有方面类别检测模型存在以下一些问题:(1)在知识的引入过程中缺乏筛选机制,无法针对性的引入一些核心的外部知识,因此可能会引入一些无关的噪声。(2)单一注意力机制下会存在特征提取力度不足的问题,无法兼顾不同类别的特征。(3)没有从标签嵌入的角度去区分各个方面类别,并且标签之间缺乏区分度。

【发明内容】

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010374312.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top