[发明专利]文本分析方法、装置、设备及存储介质在审

专利信息
申请号: 201910009019.5 申请日: 2019-01-04
公开(公告)号: CN109815490A 公开(公告)日: 2019-05-28
发明(设计)人: 金戈;徐亮 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06K9/62;G06F16/332
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 胡海国
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语义特征 注意力 文本分析 存储介质 向量矩阵 自然语言处理技术 人工智能技术 主成分分析 注意力机制 文本获取 计算量 语义树 分析 文本 网络
【说明书】:

发明涉及人工智能技术,进一步涉及自然语言处理技术领域,公开了一种文本分析方法、装置、设备及存储介质,所述方法包括以下步骤:根据待分析文本获取向量矩阵;使用主成分分析网络从所述向量矩阵中提取多个语义特征数据;使用自注意力机制获取任意两语义特征数据之间的注意力值;获取与所述多个语义特征数据一一对应的多个注意力评价值,任一语义特征数据的注意力评价值为根据该语义特征数据与其他所有语义特征数据之间的注意力值计算得到;根据所述多个语义特征数据、以及所述多个语义特征数据的注意力评价值生成语义树,以实现对文本的分析。本发明能够降低文本分析过程中的计算量。

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种文本分析方法、装置、设备及存储介质。

背景技术

问答系统是一种高级形式的信息检索系统,它能够使用准确、简洁的自然语言,回答用户以自然语言提出的问题。在使用时,问答系统需要先通过分析文本来判断用户的意图,才能获取到与用户意图相对应的答案。在分析文本的过程中,需要从文本中提取语义要素,才能进一步满足用户的需求。现有技术中,在文本分析的过程中,通常需要利用循环神经网络(Recurrent Neural Network,RNN),由于循环神经网络需要执行的递归操作次数较多,递归操作的耗时较长,导致在文本分析的过程计算量较大。

发明内容

本发明的主要目的在于提供了一种文本分析方法、装置、设备及存储介质,旨在解决如何降低文本分析过程中的计算量的技术问题。

为实现上述目的,本发明提供了一种文本分析方法,所述方法包括以下步骤:

根据待分析文本获取向量矩阵;

使用主成分分析网络从所述向量矩阵中提取多个语义特征数据;

使用自注意力机制获取任意两语义特征数据之间的注意力值;

获取与所述多个语义特征数据一一对应的多个注意力评价值,任一语义特征数据的注意力评价值为根据该语义特征数据与其他所有语义特征数据之间的注意力值计算得到;

根据所述多个语义特征数据、以及所述多个语义特征数据的注意力评价值生成语义树,以实现对文本的分析。

优选地,根据所述多个语义特征数据、以及所述多个语义特征数据的注意力评价值生成语义树的步骤,具体包括:

将第一语义特征数据作为根节点,所述第一语义特征数据为所述多个语义特征数据中,对应的注意力评价值最大的语义特征数据;

将多个第二语义特征数据对应作为多个第一子节点,将所述多个第一子节点连接于所述根节点,所述第二语义特征数据为所述多个语义特征数据中,除所述第一语义特征数据外且对应的所述注意力评价值不小于预设的评价阀值的所述语义特征数据;

将多个第三语义特征数据对应作为多个第二子节点,按照与所述多个第二子节点对应的多个注意力评价值从大到小的顺序,依次将各第二子节点连接于根节点,或者一第一子节点,或者其他的一第二子节点,以生成语义树,所述第三语义特征数据为所述多个语义特征数据中,除所述第一语义特征数据和所述多个第二语义特征数据外的语义特征数据。

优选地,依次将各第二子节点连接于根节点,或者一第一子节点,或者其他的一第二子节点的步骤,具体包括:

获取当前语义子树,所述当前语义子树为由相连接的多个节点组成,任一节点为根节点,或者第一子节点,或者第二子节点;

获取第一节点,所述第一节点为不属于所述当前语义子树且待连接于所述当前语义子树的一第二子节点;

在所述当前语义子树中查找目标节点,所述目标节点为所述当前语义子树的所述多个节点中,与所述第一节点之间的所述注意力值为最大的节点;

将所述第一节点连接于所述目标节点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910009019.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top