[发明专利]自然语言提问的理解方法、装置及电子设备有效
申请号: | 201711361679.7 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108108426B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 王碧波;董雪梅 | 申请(专利权)人: | 杭州汇数智通科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 程晓 |
地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 提问 理解 方法 装置 电子设备 | ||
本发明提供一种自然语言提问的理解方法、装置及电子设备,涉及自然语言处理技术领域,其中,自然语言提问的理解方法包括:获取用户端输入的自然语言提问信息;自然语言提问信息为与数据查询相关的提问信息;对自然语言提问信息进行解析,得到最小解析单元;基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令;根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果;预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。该方法能够对自然语言提问信息进行准确的识别,并匹配出高准确度的数据结果,可以应用于数据分析领域等专业的场景。
技术领域
本发明涉及自然语言处理技术领域,尤其是涉及一种自然语言提问的理解方法、装置及电子设备。
背景技术
自然语言处理是一项被人类长期关注并研究的技术,目前该技术主要应用于多语言翻译、信息查询等多个领域,并且均有很好的进展,然而将自然语言处理直接运用在数据分析上国内尚无先例。
自然语言处理分为多种不同的技术流派,一开始,基于形式语言的自然语言处理方法居主流地位,但这种技术路线无法处理富于变化的表达方法,只能机械的按照某些写好的模板或规则对语言进行翻译或生成,显得非常生硬。之后,出现了将统计数学理论引入语言处理的方式,比如,当前谷歌翻译、百度翻译等大部分机器翻译系统均是在此类系统的基础上开发而成。这种基于统计理论的自然语言处理方法,可以有效的运用大量的语料库对模型进行训练,从而习得各种语言表达的变化形式。目前在多语言翻译上表现是很好的。但是这种技术路线仍然存在如下缺陷:
(1)如果某些场景没有大量的语料积累,其识别性能就大打折扣;
(2)通过统计方法训练出来的模型,不具有精确性,难以表达或解析准确的含义。
因此,现有的自然语言处理方法无法运用于一些很专业的场景,比如数据分析领域。
发明内容
有鉴于此,本发明的目的在于提供一种自然语言提问的理解方法、装置及电子设备,能够对用户的自然语言提问信息进行准确的识别,并匹配出高准确度的数据结果,可以应用于数据分析领域等专业的场景。
第一方面,本发明实施例提供了一种自然语言提问的理解方法,包括:
获取用户端输入的自然语言提问信息;自然语言提问信息为与数据查询相关的提问信息;
对自然语言提问信息进行解析,得到最小解析单元;
基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令;
根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果;预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,对自然语言提问信息进行解析,得到最小解析单元,具体包括:
对自然语言提问信息进行分词处理,得到多个分词片段;
对多个分词片段进行实体名词识别,得到最小解析单元;最小解析单元包括:属性最小解析单元、度量最小解析单元及时间修饰结构词。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,属性最小解析单元包括属性项、计算操作项、属性逻辑关系项中至少一项;度量最小解析单元包括度量项、度量逻辑关系项、计算修饰项中至少一项。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令,具体包括:
根据最小解析单元推断自然语言提问信息所包含的数据查询逻辑;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州汇数智通科技有限公司,未经杭州汇数智通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711361679.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本处理比较方法以及装置
- 下一篇:基于混合统计建模的纹理图像检索方法