[发明专利]负面文本的推送方法、装置、系统及计算机设备在审
申请号: | 201910746137.4 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110457585A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 张国校;徐灿 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/335;G06F16/338;G06F16/35 |
代理公司: | 44224 广州华进联合专利商标代理有限公司 | 代理人: | 冯右明<国际申请>=<国际公布>=<进入 |
地址: | 518000广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 文本识别 标识对象 文本类型 推送信息 编码器 推送 计算机设备 输出结果 文本分类 训练过程 训练文本 输出 替换 掩盖 | ||
1.一种负面文本的推送方法,其特征在于,包括:
获取待识别文本;所述待识别文本中包含有标识对象;
将所述待识别文本输入到已训练的文本识别模型中;所述已训练的文本识别模型中包含有编码器层;所述已训练的文本识别模型根据包含有所述标识对象的训练文本训练得到,且在训练过程中,所述标识对象被替换为掩盖对象;
获取所述已训练的文本识别模型的输出结果;所述输出结果根据所述编码器层输出的编码向量得到;
根据所述输出结果,确定所述待识别文本的文本类型;
若根据所述文本类型确定所述待识别文本为负面文本,输出负面文本推送信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别文本输入到已训练的文本识别模型中的步骤之前,还包括:
获取包含有所述标识对象的样本文本;
将所述样本文本中的标识对象替换为掩盖对象,得到所述训练文本;
将所述训练文本输入到预先建立的文本识别模型中进行模型训练,得到所述已训练的文本识别模型;所述文本识别模型根据预先确定的模型搭建框架建立。
3.根据权利要求2所述的方法,其特征在于,所述训练文本还包括句首标识;
所述将所述训练文本输入到预先建立的文本识别模型中进行模型训练,得到所述已训练的文本识别模型的步骤,包括:
将所述训练文本输入到预先建立的文本识别模型中的编码器层中;
获取所述句首标识在所述编码器层中的第一编码向量;
获取所述掩盖对象在所述编码器层中的第二编码向量;
根据所述第一编码向量和/或第二编码向量,得到所述训练文本在所述文本识别模型中的识别结果;
若所述识别结果满足设定的条件,结束所述文本识别模型训练,得到所述已训练的文本识别模型。
4.根据权利要求2所述的方法,其特征在于,所述文本识别模型中还包含有输出层;所述输出层中包含有全连接层和归一化层;
所述根据所述第一编码向量和/或第二编码向量,得到所述训练文本在所述文本识别模型中的识别结果的步骤,包括:
将所述第一编码向量和/或所述第二编码向量输入到所述文本识别模型的输出层中;
根据所述输出层的输出结果,确定所述训练文本对应于各个文本类型的概率,得到所述训练文本在所述文本识别模型中的识别结果。
5.根据权利要求4所述的方法,其特征在于,所述若所述识别结果满足设定的条件,结束所述文本识别模型的训练,得到所述已训练的文本识别模型的步骤,包括:
从所述识别结果中,确定第一编码向量输入到输出层对应的第一结果、第二编码向量输入到输出层对应的第二结果、以及第一编码向量和第二编码向量输入到输出层对应的第三结果;
获取所述训练文本的实际结果;
若所述第一结果、第二结果和第三结果中,存在与所述实际结果相似度满足设定的条件的目标结果,结束所述文本识别模型的训练;
根据所述目标结果,得到所述已训练的文本识别模型。
6.根据权利要求2至5任一项所述的方法,其特征在于,所述获取包含有所述标识对象的样本文本的步骤之前,还包括:
从预先划分的多个领域中,确定所述标识对象所在的目标领域;
通过数据获取工具从网络文本中获取所述目标领域的多个候选文本;
从所述多个候选文本中筛选出包含有所述标识对象的候选文本,作为所述样本文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910746137.4/1.html,转载请声明来源钻瓜专利网。