首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于文本相似度的数据处理方法、装置以及电子设备有效

申请号：	202010730282.6	申请日：	2020-07-27
公开（公告）号：	CN111737438B	公开（公告）日：	2020-11-27
发明（设计）人：	娄东方;林金曙;廖智霖;陈华华;王炯亮;张奇明	申请（专利权）人：	恒生电子股份有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F16/35;G06K9/62
代理公司：	杭州华鼎知识产权代理事务所(普通合伙) 33217	代理人：	方艳
地址：	310053 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于文本相似数据处理方法装置以及电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于文本相似度的数据处理方法，其特征在于，所述数据处理方法包括：

获取标准问题集合与测试用问题集合，计算测试用问题与标准问题之间的相似度，以三元组形式对相似度计算结果进行标注；

构建相似度预训练模型，将已标注的三元组导入相似度预训练模型中进行信息融合训练，得到训练后的文本相似度基准模型；

向训练后的文本相似度基准模型输入客户提出的问题，得到模型输出的比对结果；

其中，所述获取标准问题集合与测试用问题集合，计算测试用问题与标准问题之间的相似度，以三元组形式对相似度计算结果进行标注，包括：

从标准问题集合、测试用问题集合中逐个提取标准问题以及测试用问题，按测试用问题、标准问题一、标准问题二的格式进行组合得到三元组；

分别计算三元组中测试用问题与任一标准问题的相似度，基于计算结果结合预设阈值对三元组内的问题顺序进行调整；

所述构建相似度预训练模型，将已标注的三元组导入相似度预训练模型中进行信息融合训练，得到训练后的文本相似度基准模型，包括：

基于循环神经网络构建相似度预训练模型中的文本编码初始模型；

根据注意力机制将测试用问题和标准问题的信息融合，并更新文本编码；

再基于循环神经网络对当前文本编码进行更新，得到最终文本编码；

对三元组文本编码基于目标函数进行优化处理，调整两两相似度差异，得到最终的文本相似度基准模型。

2.根据权利要求1所述的基于文本相似度的数据处理方法，其特征在于，所述分别计算三元组中测试用问题与任一标准问题的相似度结果，基于计算结果结合预设阈值对三元组内的问题顺序进行调整，包括：

计算测试用问题与标准问题一的相似度结果一，以及测试用问题与标准问题二的相似度结果二；

基于相似度结果一与相似度结果二的数值，对标准问题一与标准问题二在三元组内的顺序进行调整。

3.根据权利要求1所述的基于文本相似度的数据处理方法，其特征在于，所述根据注意力机制将测试用问题和标准问题的信息融合，包括：

在编码过程中，获取测试用问题与标准问题中每个词经过循环神经网络编码后的向量；

根据标准问题中的向量对测试用问题中的每个向量进行调整，根据测试用问题中的向量对标准问题中的每个向量进行调整。

4.根据权利要求1所述的基于文本相似度的数据处理方法，其特征在于，所述目标函数如公式一所示，

公式一，

式中，为已标注的三元组结构，为计算之间的相似度运算符，为计算之间的相似度运算符，为相似度差异阈值，

其中，的运算方式为，代表测试用问题，代表标准问题一，代表标准问题二，为的模长归一化向量表示符。

5.根据权利要求1所述的基于文本相似度的数据处理方法，其特征在于，所述数据处理方法，还包括：

新增相似度三元组标注数据，对之前预训练得到的文本相似度基准模型继续训练，更新模型参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于恒生电子股份有限公司，未经恒生电子股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010730282.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于微内核系统的子程序运行方法、装置和电子设备
下一篇：同层等量回灌井

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top