[发明专利]一种数据处理方法以及设备在审
申请号: | 202010441254.2 | 申请日: | 2020-05-22 |
公开(公告)号: | CN112749275A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 刘巍 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 以及 设备 | ||
本申请实施例公开一种数据处理方法以及设备,其中方法包括如下步骤:获取目标文本中的词汇的词向量,从目标文本中获取具有情感特征的目标词汇;根据所述词向量生成目标文本对应的第一文本向量;根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;根据所述第三文本向量,生成所述目标词汇的情感概率向量;根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。采用本申请,可以提高预测文本中词汇的情感类别的准确性。
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法以及设备。
背景技术
近年来,目标情感分析预测作为情感分析任务,已成为自然语言处理领域的研究热点之一。目标情感分析需要针对文本中不同的目标词汇来分析其情感极性,这不仅依赖于文本的上下文信息,同时也要考虑文本中不同目标的情感信息。例如句子“Good foodbut dreadful service at that restaurant”,目标词“food”是积极情感,而目标词“service”则是消极情感。所以在同一个文本中不同的目标词可能会出现相反的情感极性。传统的情感分析方法中,文本中词汇的词向量的生成没有考虑单词之间相对位置的关系,同时,词向量可能非常长,同一句子中的不同目标往往被预测为相同的情感极性,导致目标情感分析结果的准确性大大降低。
发明内容
本申请实施例提供一种数据处理方法以及设备,可以提高预测文本中词汇的情感类别的准确性。
本申请实施例一方面提供了一种数据处理方法,可包括:
获取目标文本中的词汇的词向量,从目标文本中获取具有情感特征的目标词汇;
根据所述词向量生成目标文本对应的第一文本向量;
根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;
根据所述第三文本向量,生成所述目标词汇的情感概率向量;
根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。
其中,所述获取目标文本中的词汇的词向量,包括:
将所述目标文本输入词向量转换模型,统计目标文本中的词汇在检测窗口中出现的次数,通过所述词汇在检测窗口中出现的次数和词向量转换模型生成目标文本中的词汇的词向量。
其中,所述根据所述词向量生成目标文本对应的第一文本向量,包括:
将所述目标文本中的词汇的词向量作为卷积层的输入,通过卷积层进行卷积处理;
将所述卷积处理后的词向量通过全连接层,生成与词向量的维度相同的第一文本向量。
其中,所述根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量,包括:
将所述第一文本向量和目标词向量相加,得到第二文本向量,所述第二文本向量与所述词向量的维度相同;
将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果;
将所述第一向量卷积结果输入至分类网络模型中的第二块结构进行卷积处理,得到第二向量卷积结果,将所述第二向量卷积结果确定为第三文本向量;
所述分类网络模型包括第一块结构和第二块结构。
其中,所述将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010441254.2/2.html,转载请声明来源钻瓜专利网。