[发明专利]一种公司形象提升系统的数据关联匹配系统有效
申请号: | 201911185159.4 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110968795B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 杨开著;于灏;陈睿欣;郑厚清;刘睿;贾德香;孙艺新;王西胜;张炜乐;陈爽;曹瑾;李艳娜;刘素蔚;王玓;王智敏;陈光;柳占杰;刘威;高洪达;李心达;崔维平;王程 | 申请(专利权)人: | 国网能源研究院有限公司;国网北京市电力公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/33;G06F16/35;G06F40/289;G06F40/30 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 李斌 |
地址: | 102209 北京市昌平区北七*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公司 形象 提升 系统 数据 关联 匹配 | ||
1.一种公司形象提升系统的数据关联匹配系统,其特征在于:包括数据关联匹配模块、社交媒体数据抽取模块与客户服务数据,所述数据关联匹配模块由业务关键字抽取模块、深度神经网络关联匹配模块、数据匹配强度训练模块、客户需求预判模块四个子模块组成,其中,所述社交媒体数据抽取模块与深度神经网络关联匹配模块之间通讯连接,所述客户服务数据与业务关键字抽取模块之间通讯连接,所述数据关联匹配模块采用Neural IR的方式对数据进行匹配关联,通过深度神经网络将离散数据转换为语义表示;
所述业务关键字抽取模块由学习模块与抽取模块组成,其中,学习模块构建条件概率分布模型,抽取模块利用学习模块的条件概率分布模型,对待抽取的客户服务数据进行标注;
所述条件概率分布模型为:
(ynew,1,ynew,2,…,ynew,n)=arg min P(ynew,1,ynew,2,…,ynew,n|xnew,1,xnew,2,…,xnew,n)
其中,
所述社交媒体数据抽取模块提取出的社交媒体数据,与业务关键字抽取模块的业务关键字标注序列,作为深度神经网络关联匹配模块的文本输入数据,经处理后可得到两段文本数据的匹配强度,用于衡量两段文本数据的关联程度,具体步骤如下:
步骤一:映射词向量序列;
步骤二:构建相似度矩阵;
步骤三:通过DRMM模型计算匹配评分;
所述数据匹配强度训练模块,完成关联匹配模型的搭建后,输入具体的业务数据,采用基于Pairwise的learning-to-rank框架、基于hinge损失对整个模型进行训练,根据模型的匹配强度与具体业务数据的匹配标记设置合理的阈值,完成对深度神经网络关联匹配模块的匹配强度阈值训练;
所述客户需求预判模块通过深度神经网络关联匹配模块对业务关键字与社交媒体数据的匹配强度判别,客户需求预判模块分析社交媒体数据,对客户的潜在需求做出预判。
2.根据权利要求1所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:所述学习模块将有带标注的客户服务数据作训练集,根据已有的标注,通过构建的条件概率分布模型,将其用一个条件概率分布进行表示。
3.根据权利要求1所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:所述业务关键字抽取模块采用最大熵马尔科夫模型信息抽取技术对关键字进行抽取。
4.根据权利要求1所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:在所述映射词向量序列中,采用基于统计的中文分词技术对模块的输入文本进行分词,使用n-gram模型实现中文分词。
5.根据权利要求1所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:在所述构建相似度矩阵中,对于给定的两段待匹配数据,经映射得到词向量序列后,对其做归一化处理,并采用余弦相似度的计算方式计算单词两两之间的相似度,构建相似度矩阵。
6.根据权利要求5所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:上述所得的相似度矩阵,利用卷积神经网络提取高层次匹配特征,采用了多层感知机对抽取的特征进行映射。
7.根据权利要求6所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:借鉴DRMM模型,对上述相似度矩阵进行直方图映射的方法分级。
8.根据权利要求6所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:利用Term Gating Network得到上述提取的高层次匹配特征的权重分布,计算相关性评分。
9.根据权利要求1所述的一种公司形象提升系统的数据关联匹配系统,其特征在于:所述数据匹配强度训练模块采用Ranking SVM算法实现基于Pairwise的learning-to-rank框架的hinge损失计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网能源研究院有限公司;国网北京市电力公司,未经国网能源研究院有限公司;国网北京市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911185159.4/1.html,转载请声明来源钻瓜专利网。