[发明专利]一种文本评价方法、装置、设备以及可读存储介质有效
申请号: | 201811172236.8 | 申请日: | 2018-10-09 |
公开(公告)号: | CN109471915B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 张凯波;盛志超;陈志刚;魏思;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F16/30 | 分类号: | G06F16/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 评价 方法 装置 设备 以及 可读 存储 介质 | ||
1.一种文本评价方法,其特征在于,包括:
获取待评价文本;
基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在所述待评价文本的整体内容中的上下文语义信息;
将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果;
其中,基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,包括:
基于预先建立的词向量确定模型获得所述待评价文本中每个词对应的包含词本身语义信息的第一语义词向量和包含词的局部上下文语义信息的第二语义词向量;
对于所述待评价文本中的每个词,将该词对应的第一语义词向量与至少一个词对应的第二语义词向量通过至少一个双线性矩阵变换,获得至少一个变换结果向量;若所述变换结果向量为一个,则将所述变换结果向量确定为该词对应的目标词向量,若所述变换结果向量为多个,则将多个变换结果向量进行拼接,将拼接后得到的向量确定为该词对应的目标词向量。
2.根据权利要求1所述的文本评价方法,其特征在于,基于预先建立的词向量确定模型获得所述待评价文本中每个词对应的第一语义词向量和第二语义词向量,包括:
利用两个词向量确定模型获得所述待评价文本中每个词对应的第一语义词向量和第二语义词向量;
其中,所述两个词向量确定模型中的第一词向量确定模型用于获得所述待评价文本中每个词对应的包含自身语义信息的词向量,所述两个词向量确定模型中的第二词向量确定模型用于获得所述待评价文本中每个词对应的包含局部上下文语义信息的词向量。
3.根据权利要求2所述的文本评价方法,其特征在于,所述第一词向量确定模型为用于训练语义特征的词向量模型;
所述第二词向量确定模型为带有记忆功能的词向量模型。
4.根据权利要求3所述的文本评价方法,其特征在于,所述利用两个词向量确定模型获得所述待评价文本中每个词对应的第一语义词向量和第二语义词向量,包括:
对所述待评价文本的内容进行分词处理,分词处理后得到所述待评价文本中的各个词;
对于所述待评价文本中的每个词,将该词输入所述第一词向量确定模型,获得只包含该词自身语义信息的词向量,作为该词对应的第一语义词向量;
将所述待评价文本中各个词对应的第一语义词向量输入所述第二词向量确定模型,获得每个词对应的、包含局部上下文语义信息的词向量,作为与每个词对应的第二语义词向量。
5.根据权利要求1所述的文本评价方法,其特征在于,所述将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果,包括:
基于所述待评价文本中每个词对应的目标词向量,通过所述评价模型确定整个待评价文本对应的词向量,并以所述整个待评价文本对应的词向量通过所述评价模型预测所述待评价文本的评价结果;
其中,所述评价模型基于多个主题的文本训练得到。
6.根据权利要求1或5所述的文本评价方法,其特征在于,所述评价模型包括特征提取模块和具有记忆功能的特征表征模块;
所述特征提取模块至少一层,输入为词对应的词向量,输出为变换后词对应的特征向量,若为多层,输出为拼接后的特征向量;
所述特征表征模块至少一层,输入为所述特征向量,输出为整个待评价文本对应的词向量,若为多层,输出为整个待评价文本对应的、拼接后的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811172236.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种位置确定方法、装置和存储介质
- 下一篇:天气预报生成方法及装置