[发明专利]文本分析方法、装置、计算机装置及计算机存储介质在审
申请号: | 201910555929.3 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110427610A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 孙芬;刘丽华 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 文本 文本分析 计算机装置 情感识别 权重调整 词向量 权重 计算机存储介质 相乘 递归神经网络 人工智能技术 词语转换 存储介质 情感类别 分析 连接层 词语 分类 | ||
1.一种文本分析方法,其特征在于,所述方法包括:
获取待分析文本;
将所述待分析文本的各个词语转换为词向量;
将所述词向量输入情感识别模型中的双向长短时记忆递归神经网络,得到所述待分析文本的各个词语的特征向量;
计算所述特征向量的权重;
将所述特征向量与对应的所述权重相乘,得到经过权重调整后的特征向量;
将所述经过权重调整后的特征向量输入所述情感识别模型中的全连接层,得到所述待识别文本的情感类别。
2.如权利要求1所述的方法,其特征在于,所述将所述待分析文本的各个词语转换为词向量包括:
对所述待识别文本进行分词,得到所述待识别文本的各个词语;
用word2vec工具将所述待分析文本的各个词语转换为词向量。
3.如权利要求2所述的方法,其特征在于,所述对所述待识别文本进行分词包括:
利用结巴分词对所述待识别文本进行分词;或者
利用特定字符对所述待识别文本进行分词;或者
利用词典库对所述待识别文本进行分词。
4.如权利要求1所述的方法,其特征在于,所述获取待分析文本包括:
接收用户输入的文字,将所述用户输入的文字作为所述待分析文本;或者
接受用户输入的语音,对所述语音进行识别,得到所述待分析文本;或者
接收用户输入的文本图像,从所述文本图像进行识别,得到所述待分析文本;或者
从预定数据源获取所述待分析文本。
5.如权利要求1所述的方法,其特征在于,所述情感识别模型还包括第一隐层和第二隐层,所述计算所述特征向量的权重包括:
将所述特征向量输入所述第一隐层,并通过激活函数激活,得到中间值;
将所述中间值输入所述第二隐层,并通过输出函数输出,得到所述权重。
6.如权利要求1所述的方法,其特征在于,所述将所述经过权重调整后的特征向量输入所述情感识别模型中的全连接层,得到所述待识别文本的情感类别包括:
将所述经过权重调整后的特征向量输入所述全连接层,得到联合特征向量;
将所述联合特征向量通过输出函数输出,得到所述待识别文本的情感类别。
7.如权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
确定所述特征向量中权重大于或等于预设值的目标特征向量;
将所述待识别文本中所述目标特征向量对应的词语作为所述待识别文本的文本摘要。
8.一种文本分析装置,其特征在于,所述装置包括:
获取模块,用于获取待分析文本;
转换模块,用于将所述待分析文本的各个词语转换为词向量;
特征提取模块,用于将所述词向量输入情感识别模型中的双向长短时记忆递归神经网络,得到所述待分析文本的各个词语的特征向量;
第一计算模块,用于计算所述特征向量的权重;
第二计算模块,用于将所述特征向量与对应的所述权重相乘,得到经过权重调整后的特征向量;
识别模块,用于将所述经过权重调整后的特征向量输入所述情感识别模型中的全连接层,得到所述待识别文本的情感类别。
9.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1-7中任一项所述文本分析方法。
10.一种计算机存储介质,所述计算机存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述文本分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910555929.3/1.html,转载请声明来源钻瓜专利网。