[发明专利]一种文本分析方法、装置及存储介质在审
申请号: | 201910220954.6 | 申请日: | 2019-03-22 |
公开(公告)号: | CN110032736A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰科技(上海)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200336 上海市长宁区威*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种文本分析方法、装置及存储介质,涉及文本分类领域,用以解决现有技术中,将情感分类视为文本分类的一般任务,而忽略了文本蕴含的情感因素的问题。该方法中,通过情感词典得到待分析文本的由情感值构成的第一向量,以及通过具有注意力机制的长短时记忆网络模型得到待分析文本的由注意力权重构成的第二向量。若计算第一向量和第二向量的距离小于第一预设阈值,则得到待分析文本表达的情感。这样,通过将情感词典、注意力机制以及长短时记忆网络模型进行结合,实现了对待分析本文的情感因素的挖掘。 | ||
搜索关键词: | 向量 注意力机制 存储介质 记忆网络 情感词典 情感因素 文本分类 文本分析 文本 分析 情感分类 文本表达 权重 预设 注意力 挖掘 申请 | ||
【主权项】:
1.一种文本分析方法,其特征在于,所述方法包括:获取待分析文本;通过预先训练好的具有注意力机制的长短时记忆网络模型分析对所述待分析文本进行分析,得到所述待分析文本表达的情感;其中,所述网络模型是根据以下方法训练得到的:读取样本文本;并根据情感词典得到所述样本文本的由情感值构成的第一向量;并,将读取的样本文本输入到待训练的所述网络模型中得到所述样本文本的由注意力权重构成的第二向量;计算所述第一向量和所述第二向量的距离,通过调整所述网络模型的参数使得所述距离小于第一预设阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰科技(上海)有限公司,未经深兰科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910220954.6/,转载请声明来源钻瓜专利网。