[发明专利]一种基于疑问语义的自然语言语义计算的方法及装置有效
申请号: | 201510510604.5 | 申请日: | 2015-08-19 |
公开(公告)号: | CN105068995B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 刘战雄 | 申请(专利权)人: | 刘战雄 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 065201 河北省廊坊市*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 语义标注 语句 标注 自然语言语义 语义树 运算符 计算方法及装置 自然语言处理 自然语言搜索 机器翻译 疑问代词 汉语 | ||
1.一种基于疑问语义的自然语言语义计算的方法,其特征在于,所述方法包括:
设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词;
根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符;利用疑问对象性质、运算符性质以及运算规则进行处理,进而建立所述疑问语义树,所述疑问语义树的节点为字符块,所述疑问语义树的边为标注符号,所述疑问语义树可以分解与合并;
通过统计疑问语义树及疑问语义子树,统计出相应的疑问语义句模,进而建立疑问语义句模库,所述疑问语义句模库用来驱动语义规则;
根据所述疑问对象或所述疑问运算符的性质和规则,结合所述疑问语义句模库、统计方法和疑问语义树,实现待处理语句的疑问语义计算;
所述方法还包括:
将搜索字符通过预先设置的算法划分为预先设置的疑问对象;
根据划分后的疑问代词搜索预先存储的字符;
若划分后的疑问代词和预先存储的字符对应,则显示与所述预先存储的字符对应的划分前的待处理的字符。
2.根据权利要求1所述的方法,其特征在于,所述设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词,包括:
根据不同的语义场景或者不同的应用场景设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词。
3.根据权利要求1所述的方法,其特征在于,所述根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符,包括:
若所述语义范畴为人,则与人对应的疑问代词为“谁”;
若所述语义范畴为事物,则与事物对应的疑问代词为“什么”;
若所述语义范畴为动作,则与所述动作对应的疑问代词为“怎么”,与所述“怎么”疑问语义等同的其他疑问代词为怎么样、怎样、怎、怎么着、怎的和如何;
若所述语义范畴为时间,则与所述时间对应的疑问代词为几时,与所述“几时”疑问语义等同的其他疑问代词为多会儿、哪会儿和多咱;
若所述语义范畴为地点场所,则与所述地点场所对应的疑问代词为哪里,与所述“哪里”疑问语义等同的其他疑问代词为哪和哪儿;
若所述语义范畴为数目数量,则与所述数目数量对应的疑问代词为多少,与所述多少等同的其他疑问代词为几和多;
若所述语义范畴为虚词,则将所述语义范畴切分并标注为疑问运算符。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括:
接收用户输入的搜索字符;
根据所述搜索字符和相似度计算获取预先存储的字符模型;
根据所述预先存储的字符模块划分为预先设置的疑问对象;
根据划分后的疑问代词搜索预先存储的字符;
若划分后的疑问代词和预先存储的字符对应,则显示与所述预先存储的字符对应的划分前的待处理的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘战雄,未经刘战雄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510510604.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交互式预测输入法
- 下一篇:一种药品信息的自然语言处理方法及系统