[发明专利]语义识别方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202011211479.5 | 申请日: | 2020-11-03 |
公开(公告)号: | CN113408292A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 王明 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/295;G06F16/33 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 韩绍君 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请公开了一种语义识别方法、装置、电子设备及存储介质。其中,该方法包括:在获取待识别文本时,基于待识别文本在标注文本索引库中获取候选文本集合,并在候选文本集合中获取与待识别语句最匹配的标注文本作为目标文本,从而根据目标文本对应的语义标注信息标注待识别文本,获得语义标注结果。如此,可以通过匹配的目标文本标注待识别文本,从而可以不经过实体模型对实体的抽取,快速获得待识别文本的语义识别结果,提升语义识别的响应速度,降低延迟。
技术领域
本申请涉及自然语言处理技术领域,更具体地,涉及一种语义识别方法,装置及计算机可读存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。自然语言处理(NLP,Nature Language Processing)是人工智能中的一个重要方向,主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
目前,常用的语义识别方案通常需要先通过机器学习模型识别文本中具有特定意义的实体,例如歌名、人名及地名等,而机器学习模型的训练耗时较长,影响语义识别的效率。
发明内容
有鉴于此,本申请实施例提出了一种语义识别方法、装置、电子设备及计算机可读存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种语义识别方法,该方法包括:
获取待识别文本;
根据所述待识别文本在标注文本索引库中获取候选文本集合;所述标注文本索引库包括多个具有语义标注信息的标注文本;
在所述候选文本集合中获取与所述待识别语句最匹配的标注文本作为目标文本;
根据目标文本对应的语义标注信息标注所述待识别文本,获得语义标注结果。
第二方面,本申请实施例提供了一种语义识别装置,该装置包括:
待识别文本获取模块,用于获取待识别文本;
候选文本集合获取模块,用于根据所述待识别文本在标注文本索引库中获取候选文本集合;所述标注文本索引库包括多个具有语义标注信息的标注文本;
目标文本获取模块,用于在所述候选文本集合中获取与所述待识别语句最匹配的标注文本作为目标文本;
语义标注模块,用于根据目标文本对应的语义标注信息标注所述待识别文本,获得语义标注结果。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面提供的语义识别方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的语义识别方法。
本申请实施例提供的方案,在获取待识别文本时,基于待识别文本在标注文本索引库中获取候选文本集合,并在候选文本集合中获取与待识别语句最匹配的标注文本作为目标文本,从而根据目标文本对应的语义标注信息标注待识别文本,获得语义标注结果。如此,可以通过匹配的目标文本的语义标注信息标注待识别文本,从而可以不经过实体模型对实体的抽取,快速获得待识别文本的语义识别结果,提升语义识别的响应速度,降低延迟。
本申请实施例的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011211479.5/2.html,转载请声明来源钻瓜专利网。