[发明专利]一种语义识别方法、相关装置以及设备有效
申请号: | 202110649311.0 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113255345B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 刘志煌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/237;G06F40/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 识别 方法 相关 装置 以及 设备 | ||
本申请实施例公开了一种应用于自然语言处理的语义识别方法、相关装置以及设备,用于提高语义识别的准确度。本申请实施例方法包括:获取待识别文本,待识别文本中包含待识别多义词,待识别多义词包括N种语义类型,待识别文本中包括至少两个语句。获取待识别文本的主题词语和词语序列,并根据主题词语和词语序列,确定待识别多义词的语义识别特征。然后根据语义识别特征,从N种语义类型中,确定待识别多义词在待识别文本中的含义。
技术领域
本申请实施例涉及人工智能领域,尤其涉及一种语义识别方法、相关装置以及设备。
背景技术
在自然语言处理中,一词多义是经常出现的情况,也是许多场景中需要解决的问题。无论是中文还是其他的语言,都会出现一词多义的情形。也即是说,相同的词语在不同的语境或者不同的上下文中,会呈现出不同的含义。如何准确识别多义词的具体含义成为了急需解决的问题。
一种语义识别的方式是,在对待识别多义词进行语义识别时,可以将同一句话中待识别多义词前后几个词作为参考词。由于参考词和待识别多义词在同一句话中,参考词对于待识别多义词的影响较大,因此,可以通过识别参考词的含义,来表征待识别多义词的含义。
在这种语义识别的方法中,若待识别多义词是一个语句中的首个词语或者最后一个词语,那么用来进行语义识别的参考词的数量就会减少,降低了语义识别的准确度。
发明内容
本申请实施例提供了一种语义识别方法、相关装置以及设备,在对待识别多义词进行语义识别时,不仅会将待识别多义词上下文的词语序列作为参考因素,还会参考待识别多义词所在的待识别文本的主题词语,丰富了语义识别的参考因素,从而提高了语义识别的准确度。
本申请实施例一方面提供了一种语义识别方法,包括:
获取待识别文本,其中,待识别文本包括待识别多义词,待识别多义词包括N种语义类型,N为大于1的整数,待识别文本包括至少两个语句;
根据待识别文本获取主题词语其中,主题词语用于表示待识别文本的主题类型;
根据待识别文本获取词语序列,其中,词语序列包括待识别多义词和目标词语,目标词语包括待识别多义词的上文词语和下文词语中的至少一项;
根据主题词语和词语序列,确定待识别多义词对应的语义识别特征;
根据语义识别特征,从N种语义类型中确定待识别多义词在待识别文本中的含义。
本申请另一方面提供了一种语义识别装置,包括:
获取单元,具体用于获取待识别文本,其中,待识别文本包括待识别多义词,待识别多义词包括N种语义类型,N为大于1的整数,待识别文本包括至少两个语句;
处理单元,具体用于:
根据待识别文本获取主题词语,其中,主题词语用于表示待识别文本的主题类型;
根据待识别文本获取词语序列,其中,词语序列包括待识别多义词和目标词语,目标词语包括待识别多义词的上文词语和下文词语中的至少一项;
根据主题词语和词语序列,确定待识别多义词对应的语义识别特征;
根据语义识别特征,从N种语义类型中确定待识别多义词在待识别文本中的含义。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体用于:
从文本集合的主题词语集合中,确定主题词语对应的关联主题词语;
从文本集合的词语序列集合中,确定词语序列对应的关联词语序列;
根据关联主题词语和关联词语序列,确定待识别多义词的语义识别特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110649311.0/2.html,转载请声明来源钻瓜专利网。