[发明专利]一种数据处理方法以及设备在审

申请号：	202010441254.2	申请日：	2020-05-22
公开（公告）号：	CN112749275A	公开（公告）日：	2021-05-04
发明（设计）人：	刘巍	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06K9/62;G06N3/04;G06N3/08
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	熊永强;杜维
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据处理方法以及设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开一种数据处理方法以及设备，其中方法包括如下步骤：获取目标文本中的词汇的词向量，从目标文本中获取具有情感特征的目标词汇；根据所述词向量生成目标文本对应的第一文本向量；根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量；根据所述第三文本向量，生成所述目标词汇的情感概率向量；根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。采用本申请，可以提高预测文本中词汇的情感类别的准确性。

技术领域

本申请涉及互联网技术领域，尤其涉及一种数据处理方法以及设备。

背景技术

近年来，目标情感分析预测作为情感分析任务，已成为自然语言处理领域的研究热点之一。目标情感分析需要针对文本中不同的目标词汇来分析其情感极性，这不仅依赖于文本的上下文信息，同时也要考虑文本中不同目标的情感信息。例如句子“Good foodbut dreadful service at that restaurant”，目标词“food”是积极情感，而目标词“service”则是消极情感。所以在同一个文本中不同的目标词可能会出现相反的情感极性。传统的情感分析方法中，文本中词汇的词向量的生成没有考虑单词之间相对位置的关系，同时，词向量可能非常长，同一句子中的不同目标往往被预测为相同的情感极性，导致目标情感分析结果的准确性大大降低。

发明内容

本申请实施例提供一种数据处理方法以及设备，可以提高预测文本中词汇的情感类别的准确性。

本申请实施例一方面提供了一种数据处理方法，可包括：

获取目标文本中的词汇的词向量，从目标文本中获取具有情感特征的目标词汇；

根据所述词向量生成目标文本对应的第一文本向量；

根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量；

根据所述第三文本向量，生成所述目标词汇的情感概率向量；

根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。

其中，所述获取目标文本中的词汇的词向量，包括：

将所述目标文本输入词向量转换模型，统计目标文本中的词汇在检测窗口中出现的次数，通过所述词汇在检测窗口中出现的次数和词向量转换模型生成目标文本中的词汇的词向量。

其中，所述根据所述词向量生成目标文本对应的第一文本向量，包括：

将所述目标文本中的词汇的词向量作为卷积层的输入，通过卷积层进行卷积处理；