[发明专利]一种自然语言解析方法、装置、服务器及存储介质有效
申请号: | 201810713935.2 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108959257B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 徐威;纪友升;王文敏;梁一川;凌光;周超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06N5/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然语言 解析 方法 装置 服务器 存储 介质 | ||
本发明实施例公开了一种自然语言解析方法、装置、服务器及存储介质,其中,所述方法包括:将待解析的自然语言文本进行切词,得到对应的多个切词片段;对每个切词片段进行概念标注,得到至少一个概念标签;对所述至少一个概念标签进行排列组合,得到多个概念标签序列;针对每个概念标签序列,结合预先建立的实体意图知识网络进行意图推导,得到所述自然语言文本的意图和槽位,其中,所述实体意图知识网络中包括多个不同业务场景的实体意图集合,且不同业务场景的实体意图集合之间通过实体相互关联。本发明实施例通过对实体进行抽象,不同的实体可以复用通用的意图知识,不同业务场景只需引入需要的实体知识,即可快速推导相关实体的真实意图。
技术领域
本发明实施例涉及自然语言技术领域,尤其涉及一种自然语言解析方法、装置、服务器及存储介质。
背景技术
自然语言理解技术是将人类语言文字转换成计算机能够识别和理解的数据格式,以便在不同的应用系统中,计算机能够为使用者的不同需求提供服务。例如,在人机交互产品中,计算机需要将用户输入的自然语言转换成结构化的数据,进而确定用户想要表达的真实意图,以供后续的具体业务逻辑处理。
现有技术中,通常是利用简单的模板匹配方法从用户输入的自然语言对应的文本信息中识别用户的意图。然而,模板是根据具体要进行自然语言理解的应用场景或业务场景预设的,每个场景都需要事先独立编写对应的模板,模板之间不能复用,于是增加了开发成本。
发明内容
本发明实施例提供了一种自然语言解析方法、装置、服务器及存储介质,以解决现有技术中存在的必须独立编写与需要进行自然语言理解的应用场景或业务场景对应的模板,且各模板之间不能复用的技术问题。
第一方面,本发明实施例提供了一种自然语言解析方法,包括:
将待解析的自然语言文本进行切词,得到对应的多个切词片段;
对每个切词片段进行概念标注,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
对所述至少一个概念标签进行排列组合,得到多个概念标签序列,其中,在不同的概念标签序列之间,各概念标签序列中的概念标签所覆盖的切词边界不重合;
针对每个概念标签序列,结合预先建立的实体意图知识网络进行意图推导,得到所述自然语言文本的意图和槽位,其中,所述实体意图知识网络中包括多个不同业务场景的实体意图集合,且不同业务场景的实体意图集合之间通过实体相互关联。
第二方面,本发明实施例还提供了一种自然语言解析装置,包括:
切词模块,用于将待解析的自然语言文本进行切词,得到对应的多个切词片段;
概念标注模块,用于对每个切词片段进行概念标注,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
组合模块,用于对所述至少一个概念标签进行排列组合,得到多个概念标签序列,其中,在不同的概念标签序列之间,各概念标签序列中的概念标签所覆盖的切词边界不重合;
意图推导模块,用于针对每个概念标签序列,结合预先建立的实体意图知识网络进行意图推导,得到所述自然语言文本的意图和槽位,其中,所述实体意图知识网络中包括多个不同业务场景的实体意图集合,且不同业务场景的实体意图集合之间通过实体相互关联。
第三方面,本发明实施例还提供了一种服务器,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的自然语言解析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810713935.2/2.html,转载请声明来源钻瓜专利网。