[发明专利]一种基于深度语义匹配的在线评论自动回复方法有效
申请号: | 202010496399.2 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111797898B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 李齐齐;赵杨 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30;G06F40/211;G06F16/33;G06N3/04 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 语义 匹配 在线 评论 自动 回复 方法 | ||
本发明公开了一种基于深度语义匹配的在线评论自动回复方法,结合句向量余弦相似度和多维度情感匹配度,找到数据库中与输入评论语义最为接近的在线评论。具体做法是利用Canopy+Kmeans聚类获取不同主题的特征词,在此基础上利用基于先验知识的主题模型CorEx进行主题特征词扩充。同时,构建BERT‑BiLSTM情感分析模型,根据聚类得到的主题特征词,并利用依存句法分析,对在线评论进行多维度情感分析。结合句向量余弦相似度和多维度情感分析结果来匹配数据库中语义最为接近的在线评论,将该评论的商家回复进行数据增强EDA操作,选取与原句句向量余弦相似度最高的句子作为自动回复内容。本发明能方便、高效、精准地为商家提供自动回复在线评论。
技术领域
本发明属于计算机软件技术领域,涉及一种基于深度语义匹配的在线评论自动回复方法,可以有效提升电子商务平台中商家管理口碑和用户体验。
背景技术
随着互联网的普及和电子商务的大力推广,越来越多的消费者选择网上购物,也吸引到更多的商家开始在线上销售商品。在网络购物交易过程中,消费者和商家存在信息不对称且交易过程并非同步进行,相比于线下购物,这种网络购物过程会让消费者感受到较高的风险,例如商品质量,配送安全等。因此消费者往往会通过各种方式来搜集关于商家和商品的更多详细信息。其中,商品的在线评论与商家的回复就是了解更多信息的一个重要渠道,这些内容往往比商家做的广告和推广的真实性和有效性更高。
传统的文本匹配方法包括TF-IDF,Jaccrad距离,BM25等,这些方法都是基于词汇重合度计算文本相似度的。随着深度学习的发展,为了将词语更好的抽象为向量表示以便模型的后续任务,word2vec,glove等技术被提出,这些模型可以利用给定的语料数据集进行训练,高效快速的将词汇表示成向量,通过这些向量表示构建文本匹配的神经网络模型。
发明内容
本发明的目的在于为了方便、高效、精准地为商家提供自动回复在线评论,提出了一种基于深度语义匹配的在线评论自动回复方法。
本发明所采用的技术方案是:一种基于深度语义匹配的在线评论自动回复方法,其特征在于,包括以下步骤:
步骤1:对电子商务平台某一领域的评论数据进行抓取,得到在线评论、商家回复、评价星级数据、商品名以及商家名称,将有商家回复的在线评论提取出来构建回复数据库;
步骤2:对在线评论进行聚类分析,得到在线评论的不同主题的特征词;
采用Canopy+Kmeans聚类算法对在线评论进行聚类分析,再结合基于领域知识的主题模型CorEx对每个主题进行特征词扩充,得到在线评论的不同主题的特征词;
步骤3:构建在线评论的情感分析模型;
将步骤1中获得的在线评论和评价星级数据对应起来构成情感分析模型的数据集,将数据集拆分为训练集和验证集;构建基于BERT+BiLSTM的情感分析模型,利用BERT模型对在线评论进行初始化向量操作,然后将这些向量作为BiLSTM网络模型的输入进行分类模型的训练;
步骤4:构建文本匹配模型;
利用标点符号和依存句法分析,将在线评论拆分为仅包含单属性的短句,利用步骤3得到的情感分析模型对短句进行情感倾向分析,计算需要回复的在线评论与回复数据库的评论的情感匹配度;同时,计算句向量余弦相似度来比较句子间的语义相似度;将这两者的分数加权计算到一起来匹配数据库中语义最为接近的评论文本,其对应的回复内容即需要的回复。
本发明的有益效果为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010496399.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空气过滤器用高效滤芯
- 下一篇:节目同步的方法、装置、显示终端和存储介质