[发明专利]面向电商产品的评价对象识别方法、装置及存储介质有效
申请号: | 202010323083.3 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111563384B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 王振宇;简文军 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F40/289;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄国亮 |
地址: | 510641 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 产品 评价 对象 识别 方法 装置 存储 介质 | ||
本发明公开了一种面向电商产品的评价对象识别方法、装置及存储介质,其中方法包括以下步骤:将同一句子中的候选评价对象和候选评价词两两组成词对;采用词对关联度模型对词对进行关联度计算,根据计算结果获得词对集合;对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合;根据词频对候选评价对象集合内的候选评价对象进行划分,获得第一候选评价对象集合和第二候选评价对象集合;从第二候选评价对象集合获取准确评价对象,结合第一候选评价对象集合和准确评价对象获得准确评价对象集合。本发明在对评价对象召回策略中,使用字词混合向量的相似度衡量评价对象间的语义相似度,提高了评价对象召回率和准确率,可应用于意见挖掘领域。
技术领域
本发明涉及意见挖掘领域,尤其涉及一种面向电商产品的评价对象识别方法、装置及存储介质。
背景技术
随着互联网的快速兴起,电商产品平台也迎来了快速发展,目前被大众所知电商产品平台有淘宝、京东、拼多多和当当等等。电商平台的快速发展这意味着电商产品也变得更加多样化,且电商产品的内容也更为丰富。面对多样化、丰富化的电商产品,作为消费者,往往希望从平台侧面去了解相应的电商产品,而侧面信息最为突出的便是电商产品的在线评论,他们可以通过其他消费者的评论信息客观地得到产品的各维度信息。作为平台使用的商家,他们可以根据客户反馈的评论信息改进产品或制定销售策略。因此,对于电商平台的产品评论的信息处理是一个很热门的研究领域。
电商平台的产品评论信息具有数量庞大和数据格式标准不一的特点,传统处理的方法有人工审阅方法,这种方法需要耗费大量的人力和时间,且取得的效果不佳。也有使用依存句法关系的定制性规则的方法,这种方法没有考虑到文本语义信息和词序的词性特征信息。此时就需要通过结合一些深度学习的算法来帮助人类处理这些庞大的产品评论信息,快速地整理成人类可理解的结构化信息,这也是意见挖掘技术的目的。
意见挖掘技术主要以自然语言处理、信息抽取、数据挖掘等为手段,从大量的文本信息中识别和抽取出有价值的观点信息。其中一个重要的任务就是面向电商产品的评价对象的抽取。目前的评价对象抽取方法还缺乏一种高准确率和高召回率的方法。
发明内容
为了解决上述技术问题之一,本发明的目的是提供一种面向电商产品的评价对象识别方法、装置及存储介质。
本发明所采用的一技术方案是:
一种面向电商产品的评价对象识别方法,包括以下步骤:
获取第一评论语料,根据预设的词性从第一评论语料的句子中提取候选评价对象和候选评价词,将同一句子中的候选评价对象和候选评价词两两组成词对;
采用训练后的词对关联度模型对词对进行关联度计算,根据计算结果获得词对集合;
采用预设识别算法对词对集合进行迭代识别,获得候选评价对象集合和候选评价词集合;
根据词频对候选评价对象集合内的候选评价对象进行划分,获得第一候选评价对象集合和第二候选评价对象集合,所述词频为候选评价对象或候选评价词在词对集合中出现的次数;
结合字词混合向量和第一候选评价对象集合,从第二候选评价对象集合获取准确评价对象,结合第一候选评价对象集合和准确评价对象获得准确评价对象集合,所述字词混合向量为词向量和字向量的组合。
进一步,还包括对词对关联度模型进行训练的步骤,具体为:
获取第二评论语料,对第二评论语料进行文本预处理及标注,获得训练数据集;
构建词对关联度模型,采用训练数据集对词对关联度模型进行训练。
进一步,所述获取第二评论语料,对第二评论语料进行文本预处理及标注,获得训练数据集,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010323083.3/2.html,转载请声明来源钻瓜专利网。