[发明专利]首字母缩写词的消歧方法、系统、电子设备及存储介质在审

专利信息
申请号: 202110633408.2 申请日: 2021-06-07
公开(公告)号: CN113449516A 公开(公告)日: 2021-09-28
发明(设计)人: 陈海波;罗志鹏;潘春光 申请(专利权)人: 深延科技(北京)有限公司
主分类号: G06F40/274 分类号: G06F40/274;G06F16/35
代理公司: 苏州领跃知识产权代理有限公司 32370 代理人: 王宁
地址: 100081 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 首字母 缩写 方法 系统 电子设备 存储 介质
【说明书】:

本申请提供了首字母缩写词的消歧方法、系统、电子设备及存储介质。所述消歧方法包括:识别文档的句子中的目标首字母缩写词;将所识别到的所述目标首字母缩写词与预先创建的数据集相匹配,所述数据集中记载有预定数量的首字母缩写词及其对应的英文词组的全称,从而通过所述匹配,获取所识别到的目标首字母缩写词所对应的英文词组的全称;以及在获取到的全称为1个的情况下,输出所述全称;并且在获取到的全称大于1个的情况下,经由预先训练好的二分类模型输出与所述句子的句意相适应的1个全称,从而即使在1个首字母缩写词对应多种全称的情况下,也能够结合该首字母缩写词所在的句子的句意来输出正确的全称,提升用户的体验。

技术领域

本申请涉及计算机数据处理技术领域,尤其涉及首字母缩写词的消歧方法、系统、电子设备及存储介质。

背景技术

首字母缩写在许多英文文献和文档中,特别是在科学和医疗领域十分常见。通过使用首字母缩写词,人们可以避免重复使用较长的短语。例如,“CNN”的全称可以是“Convolutional Neural Network”,不过某些情况下它也可以是“Condensed NearestNeighbor”的缩写。此时,用户可能对于该首字母缩写词的全称究竟是哪一个是比较困惑的,需要自己花费时间进行判断。

了解首字母缩写及其全称之间的对应关系在自然语言处理的许多任务中至关重要,如文本分类、问答系统等。尽管使用首字母缩写词能够便利人们的书写交流,但是一个缩写词往往对应有多个全称,在一些情况下,如科学或医疗领域中,一些专业名词的缩写可能会使得对该领域不熟悉的人在理解文意时产生一些歧义。

因此,如何利用计算机技术协助人们理解不同语境下缩写词的正确含义是值得探讨的问题。本发明为了解决该问题而提出了首字母缩写词消歧即消除歧义的任务,该任务是当给定一个首字母缩写词以及该词对应的几个可能的全称时,根据上下文的文意,确定在当前语境中最合适的全称。

发明内容

本申请的目的在于提供一种首字母缩写词的消歧方法、系统、电子设备及存储介质,其能够利用计算机进行数据处理,使得即使在1个首字母缩写词包含多种全称的情况下,也能够结合该首字母缩写词所在的句子的句意来输出正确的全称,提升用户的体验。

本申请的目的采用以下技术方案实现:

第一方面,本申请提供了一种首字母缩写词的消歧方法,所述首字母缩写词由构成英文词组的多个英文单词中的各英文单词的首字母构成,所述消歧方法包括:

识别文档的句子中的目标首字母缩写词;

将所识别到的所述目标首字母缩写词与预先创建的数据集相匹配,所述数据集中记载有预定数量的首字母缩写词及其对应的英文词组的全称,从而通过所述匹配,获取所识别到的目标首字母缩写词所对应的英文词组的全称;以及

在获取到的全称为1个的情况下,输出所述全称;并且在获取到的全称大于1个的情况下,经由预先训练好的二分类模型输出与所述句子的句意相适应的1个全称。

根据上述的首字母缩写词的消歧方法,即使首字母缩写词的全称大于1个,也能够根据文档中的句子的句意自动判断并且输出正确的全称,从而使得用户能够清楚地了解该首字母缩写词对应的全称,而不需要费时地进行查询工作,从而提升了用户体验性,而且用户也不会因为由于领域不熟悉而错误将该首字母缩写词认为是其它全称,从而能够更加准确地了解句子意思。另外,还可以提供全称词典,即,将与首字母缩写词对应的全部全称向用户显示。

优选地,在第一方面的首字母缩写词的消歧方法,其中,

预先创建所述数据集的方法包括:

经由现有的数据库采集预定数量的英文论文、期刊或报告,

对于采集到的所述英文论文、期刊或报告中出现的首字母缩写词,统计并整理其全称,并且存储在所述数据集中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深延科技(北京)有限公司,未经深延科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110633408.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top