[发明专利]一种基于疑问语义的自然语言语义计算的方法及装置有效
申请号: | 201710866774.6 | 申请日: | 2015-08-19 |
公开(公告)号: | CN107562731B | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 刘战雄 | 申请(专利权)人: | 刘战雄 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 065201 河北省廊坊市*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 疑问 语义 自然语言 计算 方法 装置 | ||
本发明实施例公开了一种基于疑问语义的自然语言语义计算方法及装置,设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词;根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符;根据所述疑问对象或所述疑问运算符的性质和规则,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,作为一个基础的语义计算方法,本发明实施例可以有效的解决常见的自然语言处理问题,尤其是在语句的切分标注、自然语言搜索、机器翻译、人机问答等领域具有较高的使用价值。
技术领域
本发明实施例涉及信息处理的技术领域,尤其涉及一种基于疑问语义的自然语言语义计算的方法及装置。
背景技术
自然语言处理是研究人人、人机交际中语言问题的一门学科。在自然语言处理中,语义计算是通过计算机解释自然语言中各级单位即字、词素、词、词组、短语、句子、句群、段落、篇章等的意义,所关心的重点是这个语言单位到底说了什么。在目前技术中主要有:义素分析法、语义场、语义网络、Montague语法、优选语义学、概念依存理论、意义-文本理论等方法。
在目前技术中,语义计算的主要的缺陷表现为两方面:一方面侧重于利用统计方法进行字符运算,很少或者没有涉及语义问题;另一方面失之于语义概念抽象或规则复杂,利用计算机技术难以实现或算法复杂度高,缺乏实用性。
发明内容
本发明实施例的目的在于提出一种基于疑问语义的自然语言语义计算的方法及装置,旨在解决如何建立简单易懂的语义划分规则对自然语言进行处理的问题。
为达此目的,本发明实施例采用以下技术方案:
设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词;
根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符;
根据所述疑问对象或所述疑问运算符的性质和规则,结合所述疑问语义句模库、统计方法和疑问语义树,实现待处理语句的疑问语义计算。
优选地,所述设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词,包括:
根据不同的语义场景或者不同的应用场景设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词。
优选地,所述根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符,包括:
若所述语义范畴为人,则与人对应的疑问代词为“谁”;
若所述语义范畴为事物,则与事物对应的疑问代词为“什么”;
若所述语义范畴为动作,则与所述动作对应的疑问代词为“怎么”,与所述“怎么”疑问语义等同的其他疑问代词为怎么样、怎样、怎、怎么着、怎的和如何;
若所述语义范畴为时间,则与所述时间对应的疑问代词为几时,与所述“几时”疑问语义等同的其他疑问代词为多会儿、哪会儿和多咱;
若所述语义范畴为地点场所,则与所述地点场所对应的疑问代词为哪里,与所述“哪里”疑问语义等同的其他疑问代词为哪和哪儿;
若所述语义范畴为数目数量,则与所述数目数量对应的疑问代词为多少,与所述多少等同的其他疑问代词为几和多;
若所述语义范畴为虚词,则将所述语义范畴切分并标注为疑问运算符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘战雄,未经刘战雄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710866774.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于向量空间模型的文本挖掘系统
- 下一篇:用于应用的自动语言转化的系统和方法