[发明专利]中文语法标注在审
申请号: | 201711125822.2 | 申请日: | 2017-11-06 |
公开(公告)号: | CN109753642A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 节金旗 | 申请(专利权)人: | 节金旗 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 463816 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语法标注 中文分词 字符串文件 词性标注 检索结果 检索数据 自然语言 网络客户端软件 预处理 标点 空格 计算机程序 计算机处理 网络客户端 词性分析 中文 加载 语句 转化 | ||
1.中文语法标注是对自然语言进行计算机处理的计算机程序,其特征在于:该程序通过对中文分词词性标注文件进行必要的预处理来获得特定形式的字符串文件,针对该字符串文件进行空格、标点、词性分析,转化为各种语句的检索数据,依据检索数据在语法标注库中获得检索结果,并把检索结果处理成语法标注文件。
2.根据权利要求书1所述的中文语法标注,其特征在于:所述的预处理能够通过函数求出中文分词词性标注文件中的空格、分格符、标点等数组数据,并能通过替换函数改变特定条件下的标点标注形式,以便区别对待。
3.根据权利要求书1所述的中文语法标注,其特征在于:所述的预处理不仅包含冒号标志序号的预处理还求出了分格符前中文原字符长度的数组p02[],该数组是通过特定的程序算法求出的。
4.根据权利要求书1所述的中文语法标注,其特征在于:所述的特定形式的字符串文件,去掉了中文分词词性标注中分格符前的中文原字符,保留分格符后的词性标注。
5.根据权利要求书1所述的中文语法标注,其特征在于:所述的各种句子的检索数据是先通过对句子内的标点数量,句子长度,句子特征依据特定的程序算法组成特定的句子数组数据后再与相对应的句子词性字符按照特定的程序算法组成句子字符串数据,来作为语法标注库的查询数据。
6.根据权利要求书1所述的中文语法标注,其特征在于:所述的检索结果,不仅包含句子的词性标注还包含句子的语法标注。
7.根据权利要求书1所述的中文语法标注,其特征在于:所述的针对该字符串文件进行空格、标点、词性分析需要用到许多数组函数以及具有特定功能的挑选函数、映射函数等,这些函数被封装在数据库y800.lib和y801.lib中。
8.根据权利要求书1所述的中文语法标注,其特征在于:所述的把检索结果处理成语法标注文件是把获得的语法标注字符串经过一定的变化后由特定的函数来完成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于节金旗,未经节金旗许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711125822.2/1.html,转载请声明来源钻瓜专利网。