[发明专利]一种基于自然语言处理的空间查询主题的归类方法及装置有效
申请号: | 201811116358.5 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109271502B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 呙维;赵雨慧;李铭;朱欣焰 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/9537 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 空间 查询 主题 归类 方法 装置 | ||
本发明提供了一种基于自然语言处理的空间查询主题的归类方法及装置,其中的方法包括:通过将用户输入的自然语言分割为隔断词的集合,然后对集合内的词依次进行特征匹配与语义序列重新排列。再根据主题训练的结果查找与输入的自然语言最相邻的样本,并返回主题,以此达到对自然语言的空间查询主题归类。实现提高主题提取准确性的技术效果。
技术领域
本发明涉及自然语言技术领域,具体涉及一种基于自然语言处理的空间查询主题的归类方法及装置。
背景技术
随着新一代信息技术产业的飞速发展,个人智能助手已经成为提高生活品质的流行应用。根据用户的输入,个人智能助手可以通过自然语言理解和自动化信息处理来完成操作指令。自然语言是人工智能的分支学科,自然语言处理是使用机器处理人类语言的理论和技术,将语言做为计算对象来研究相应的算法。目的是让人类可以用自然语言形式与计算机系统进行人机交互,从而更便捷、有效地进行信息管理。从90年代末到21世纪初,人们逐渐认识到,仅用基于规则的方法或仅用基于统计的方法都是无法成功进行自然语言处理的。随后基于实例和基于规则的语料库技术应运而生。
现有自然语言处理技术,主要包括基于规则的方法和基于概率的方法两大类型,又细分为基于贝叶斯原理方法、基于隐马尔科夫模型方法、话语分析方法、神经网络方法等等。但随着人们对信息服务需求的日益增加,自然语言的语义理解仍存在主题提取困难与主题歧义等诸多问题。
随着自然语言理解技术的不断发展,自然空间查询语言的研究也有了一定的进展,取得了很多有意义的成果。主要包括自然空间查询语言涉及的词法、句法和语义内容及方法的研究与自然空间查询语言空间关系语义与细化的研究。自然语言认知与处理的相关理论和方法己趋于成熟,但是针对空间领域的自然语言研究还很少。本发明申请人在实施本发明的过程中,发现现有方法中,主要存在以下两方面的问题:一是由于自然语言词法、句法和语义灵活复杂,解译过程歧义情况多,现有研究大多只能适用于某个特定的专业领域的地理信息系统,从而长期以来仅被当作其他空间查询方式的补充方式。二是自然空间查询语言领域知识的研究和积累较少,导致空间词典总结归纳不系统,空间查询句法分析归纳不完善,同时对空间语义的现有研究成果较少。目前自然语言理解技术中,对于空间信息主题的提取,解释结果里歧义和错误较多。
由上可知,现有技术中方法存在的主题提取结果不准确的技术问题。
发明内容
有鉴于此,本发明提供了一种基于自然语言处理的空间查询主题的归类方法及装置,用以解决或者至少部分解决现有技术中方法存在的主题提取结果不准确的技术问题。
本发明第一方面提供了一种基于自然语言处理的空间查询主题的归类方法,包括:
步骤S1:基于预设隔断词将待处理的自然语言分割为词的集合;
步骤S2:将所述词的集合中的词语与预先构建的概念性词汇库进行特征匹配,获得与预设结构对应的词序列;
步骤S3:在主题训练结果集中,查找与所述待处理的自然语言最相邻的样本,其中,所述主题训练结果集由预先搜集的自然语言样例,通过所述词序列训练后获得,所述样本中包含文本和查询主题,返回所述样本中包含的查询主题,并将所述查询主题作为归类结果。
在一种实现方式中,所述预设隔断词包括:行为动词、介词、主语、特征词和疑问词。
在一种实现方式中,所述预先构建的概念性词汇库包括兴趣点、业务属性、业务属性评价、空间关系、行为动词、时间、人物、地点疑问、评价疑问、业务疑问。
在一种实现方式中,所述预设结构为“主题-动词-兴趣点-动词-物品”,步骤S2具体包括:
步骤S2.1:将所述词的集合中的词语与预先构建的概念性词汇库进行特征匹配,获得特征词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811116358.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频数据库的管理方法及系统
- 下一篇:智能问答方法、装置、设备及存储介质