[发明专利]面向电商产品的评价对象识别方法、装置及存储介质有效
申请号: | 202010323083.3 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111563384B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 王振宇;简文军 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F40/289;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄国亮 |
地址: | 510641 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 产品 评价 对象 识别 方法 装置 存储 介质 | ||
1.一种面向电商产品的评价对象识别方法,其特征在于,包括以下步骤:
获取第一评论语料,根据预设的词性从第一评论语料的句子中提取候选评价对象和候选评价词,将同一句子中的候选评价对象和候选评价词两两组成词对;
采用训练后的词对关联度模型对词对进行关联度计算,根据计算结果获得词对集合;
采用预设识别算法对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合;
根据词频对候选评价对象集合内的候选评价对象进行划分,获得第一候选评价对象集合和第二候选评价对象集合,所述词频为候选评价对象或候选评价词在词对集合中出现的次数;
结合字词混合向量和第一候选评价对象集合,从第二候选评价对象集合获取准确评价对象,结合第一候选评价对象集合和准确评价对象获得准确评价对象集合,所述字词混合向量为词向量和字向量的组合;
所述预设识别算法包括第一公式和第二公式,所述采用预设识别算法对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合,包括:
初始化候选评价对象集合和候选评价词集合为空;
从词对集合获取评价词,确定检测到评价词属于种子情感词,将评价词输入候选评价词集合;
从词对集合获取候选评价对象,结合候选评价对象、候选评价词集合和第一公式计算第一关联度,确定检测到第一关联度大于第一阈值,将候选评价对象输入候选评价对象集合;
从词对集合获取候选评价词,结合候选评价词、候选评价对象集合和第二公式计算第二关联度,确定检测到第二关联度大于第二阈值,将候选评价词输入候选评价词集合;
所述第一公式为:
其中,reli为候选评价对象oi与整个候选评价词集合的关联度,<oi,sj>为候选词对,#<oi,sj>为候选词对出现的频数,sim(<oi,sj>)为关联度模型计算的关联度;
所述第二公式为:
其中,relj为候选评价词sj与整个候选评价对象集合的关联度,<oi,sj>为候选词对,#<oi,sj>为候选词对出现的频数,sim(<oi,sj>)为关联度模型计算的关联度。
2.根据权利要求1所述的一种面向电商产品的评价对象识别方法,其特征在于,还包括对词对关联度模型进行训练的步骤,具体为:
获取第二评论语料,对第二评论语料进行文本预处理及标注,获得训练数据集;
构建词对关联度模型,采用训练数据集对词对关联度模型进行训练。
3.根据权利要求2所述的一种面向电商产品的评价对象识别方法,其特征在于,所述获取第二评论语料,对第二评论语料进行文本预处理及标注,获得训练数据集,包括:
获取第二评论语料,对第二评论语料进行预处理,获得多个评论语句,所述预处理包括对第二评论语料中语句进行分词和词性标注;
采用人工方式标注出评论语句中的评价对象和评价词,将评价对象和评价词两两组合作为词对;
构建<原句子,词对>的句子对,对词对是否存有评价搭配关系进行标注,若存有评价搭配关系,类标为第一类型;反之,类标为第二类型;
将标注后评论语句组成训练数据集,所述标注后评论语句的格式为<原句子,评价词对,原句子分词后对应的词性序列,类别>。
4.根据权利要求3所述的一种面向电商产品的评价对象识别方法,其特征在于,所述词对关联度模型为基于BERT-CNN的词对关联度模型,所述词对关联度模型包括输入层、嵌入层、编码层和分类解码层,所述采用训练数据集对词对关联度模型进行训练,包括:
采用训练数据集对编码层的参数进行微调;
采用交叉熵函数作为目标函数对词对关联度模型进行训练,获得最终的词对关联度模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010323083.3/1.html,转载请声明来源钻瓜专利网。