[发明专利]短文本描述方法和装置有效

专利信息
申请号: 201910723855.X 申请日: 2019-08-07
公开(公告)号: CN110457700B 公开(公告)日: 2020-04-21
发明(设计)人: 赵文涛;朱成璋;刘丹;李倩;李盼 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F40/295 分类号: G06F40/295;G06N3/04;G06N3/08
代理公司: 长沙国科天河知识产权代理有限公司 43225 代理人: 邱轶
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 描述 方法 装置
【说明书】:

本申请涉及一种短文本描述方法、装置、计算机设备和存储介质。所述方法包括:获取待描述短文本的词嵌入矩阵和字符嵌入矩阵,将词嵌入矩阵和字符嵌入矩阵分别输入预先设置的掩码卷积网络,得到词嵌入矩阵对应的词层面卷积特征和字符嵌入矩阵对应的字符层面卷积特征,将词层面卷积特征和字符层面卷积特征分别输入预先设置的递归神经网络模型,得到词层面卷积特征对应的词层面向量表示和字符层面卷积特征对应的字符层面向量表示,对词层面向量表示和字符层面向量表示进行叠加,得到待描述短文本的短文本描述。采用本方法能够提高短文本描述的准确性。

技术领域

本申请涉及计算机技术领域,特别是涉及一种短文本描述方法和装置。

背景技术

伴随着移动互联网和通讯技术的迅速发展,基于社交媒体、手机短信等的短文本信息进入了爆发式的增长阶段。这一类的短文本往往具有词汇少、非正式表达多、拼写错误常见几大特点。如何有效的将此类短文本嵌入到向量空间中进行深入挖掘分析具有极大的研究价值,也在诸如情感分析、顾客流失检测、问题检索和个性化推荐等各类实际应用场景中发挥着重要的作用。

现有针对短文本描述的研究方法中,大多依赖于噪声识别和稀疏扩展两大技术。然而,在许多应用的短文本识别中,短文本中的噪声形式多样、变化迅速,现有方法大多无法自适应进行识别。此外,将稀疏的短文本显式扩展为高质量密集文本更是非常困难,因此,根据目前的短文本描述无法准确解析出短文本表达的意思。

发明内容

基于此,有必要针对上述技术问题,提供一种能够解决短文本描述不够准确问题的短文本描述方法、装置、计算机设备和存储介质。

一种短文本描述方法,所述方法包括:

获取待描述短文本的词嵌入矩阵和字符嵌入矩阵;

将所述词嵌入矩阵和所述字符嵌入矩阵分别输入预先设置的掩码卷积网络,得到所述词嵌入矩阵对应的词层面卷积特征和所述字符嵌入矩阵对应的字符层面卷积特征;

将所述词层面卷积特征和所述字符层面卷积特征分别输入预先设置的递归神经网络模型,得到所述词层面卷积特征对应的词层面向量表示和所述字符层面卷积特征对应的字符层面向量表示;

对所述词层面向量表示和所述字符层面向量表示进行叠加,得到所述待描述短文本的短文本描述。

在其中一个实施例中,还包括:获取预先设置的词嵌入转换矩阵;根据所述词嵌入转换矩阵,将所述待描述短文本转换为词嵌入矩阵;获取预先设置的字符嵌入转换矩阵;根据所述字符嵌入转换矩阵,将所述待描述短文本转换为字符嵌入矩阵。

在其中一个实施例中,所述掩码卷积网络包括:词掩码卷积网络和字符掩码卷积网络;还包括:将所述词嵌入矩阵输入多个相同尺寸的词掩码卷积网络,得到对应数量的所述词嵌入矩阵对应的词特征向量;所述词掩码卷积网络的宽度是根据所述词嵌入矩阵的向量维度确定的;根据所述词特征向量,得到词层面卷积特征;将所述字符嵌入矩阵输入多个相同尺寸的字符掩码卷积网络,得到对应数量的所述词嵌入矩阵对应的字符特征向量;所述掩码卷积网络的宽度是根据所述字符嵌入矩阵的向量维度确定的;根据所述字符特征向量,得到字符层面特征。

在其中一个实施例中,所述掩码卷积网络包括掩码过滤器和掩码矩阵;所述掩码过滤器为权重矩阵;所述权重矩阵与所述掩码矩阵相位相乘对所述掩码卷积网络进行打码;还包括:根据所述权重矩阵的行组合,设置多个掩码矩阵;根据所述权重矩阵对应的掩码过滤器和多个所述掩码矩阵,设置对应数量的掩码卷积网络;将所述词嵌入矩阵和所述字符嵌入矩阵分别输入多个所述掩码卷积网络,得到所述词嵌入矩阵对应的词卷积矩阵和所述字符嵌入矩阵对应的字符卷积矩阵;采用跨过滤器的最大池化方法对所述词卷积矩阵进行合成,得到词层面卷积特征;采用跨过滤器的最大池化方法对所述字符卷积矩阵进行合成,得到字符层面卷积特征。

在其中一个实施例中,还包括:采用线性激活函数作为所述掩码卷积网络的非线性函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910723855.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top