[发明专利]基于图扩展结构的词义消歧方法、装置、设备及介质在审
申请号: | 202110602047.5 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113204962A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 倪子凡;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩展 结构 词义 方法 装置 设备 介质 | ||
本发明涉及人工智能领域,提供一种基于图扩展结构的词义消歧方法、装置、设备及介质,能够根据创建的窗口提取初始图谱中的候选节点,实现了对图谱的扩展,以改善连通性,根据每条边所对应的两个候选节点间的文本相似度及每条边所对应的两个候选节点间的词义相似度计算每条边的权重,根据每条边的权重确定每个候选节点的重要度,进而探索和捕获高度语义和情感信息,提高了词义消歧的准确度,根据每个候选节点的重要度对候选图谱进行去干扰处理,得到目标图谱,以便通过去干扰处理提高词义消歧的效率,对目标图谱进行中心度量,得到目标词义,实现了对词义消歧效果的提升。此外,本发明还涉及区块链技术,目标图谱可存储于区块链节点中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于图扩展结构的词义消歧方法、装置、设备及介质。
背景技术
自然语言处理(Natural Language Processing,NLP)的主要目标是让机器更加智能化地了解人类如何使用自然语言表达,以执行具有挑战性的语言任务。在自然语言中,许多术语、概念和单词在不同的语境中可以包含多种含义。因此,在没有清晰可识别的上下文(即描述场景的语句)的前提下,识别一个单词的实际含义是很困难的。通常情况下,至少需要一个额外的词来提供足够的信息才能够确定目标词的实际含义,这种识别单词意图的方式被称作词义消歧,主要通过确定歧义词在给定语境中的意义来实现词义消歧。在许多自然语言处理任务(如机器翻译)中,词义消歧都被视为性能改进的关键。
现有技术中,在执行词义消歧时,主要采用的方法可分为监督方法和基于知识的无监督方法。
在监督方法中,机器学习模型由语料库训练,模糊词的正确意图是由人工标注器在语料库中进行标注。但是,这种为所有语言和单词构建训练语料库的方式成本非常昂贵,因此,监督方法在可以消除歧义的单词集上通常有一定限制。
对于基于知识的无监督方法,一般采用诸如Wordnet之类的词汇知识库,通过结合上下文信息和词汇知识库上的语义知识来执行词义消歧。相比于监督方法,基于知识的无监督方法更适合于实际的词义消歧系统。现有的无监督性词义消歧法可以分为基于相似性和基于图两种类型。
其中,基于相似性的方法是通过计算一个多义词的每个可用词义与给定上下文中的其他单词之间的语义相似度,来判断多义词的正确意义,需要同时考虑分配给邻近歧义单词的意思,具有一定的局限性。
而目前主要采用的基于图的方法结构可能不完全连接,因为目标词的一些相关意义可能在语言学上(即语义上或词汇上)与同一领域不相关,这种低连通性问题,即知识不完全,可能导致在不考虑相邻语义相关词的情况下对歧义词进行消歧,产生不连贯的意思,从而造成误解。也就是说,单词表示节点,语义相关的单词之间缺乏连接(交叉),故映射这些节点的词汇关系是相互独立的,造成无法识别每个词在给定的上下文中的意思,从而无法分析歧义词之间可能的情感关系,影响处理结果的准确度。
发明内容
鉴于以上内容,有必要提供一种基于图扩展结构的词义消歧方法、装置、设备及介质,能够通过对图谱的扩展改善连通性,进而探索和捕获高度语义和情感信息,提高了词义消歧的准确度,同时通过去干扰处理提高了词义消歧的效率。
一种基于图扩展结构的词义消歧方法,所述基于图扩展结构的词义消歧方法包括:
响应于词义消歧指令,根据所述词义消歧指令获取目标词,及获取所述目标词所属的初始图谱;
创建窗口,并根据创建的窗口提取所述初始图谱中所述目标词所对应的节点的候选节点;
连接每两个候选节点作为一条边,并根据得到的边及所述候选节点构建候选图谱;
计算每条边所对应的两个候选节点间的文本相似度,及计算每条边所对应的两个候选节点间的词义相似度;
根据每条边所对应的两个候选节点间的文本相似度及每条边所对应的两个候选节点间的词义相似度计算每条边的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110602047.5/2.html,转载请声明来源钻瓜专利网。