[发明专利]中文语法标注在审

专利信息
申请号: 201711125822.2 申请日: 2017-11-06
公开(公告)号: CN109753642A 公开(公告)日: 2019-05-14
发明(设计)人: 节金旗 申请(专利权)人: 节金旗
主分类号: G06F17/24 分类号: G06F17/24;G06F17/27
代理公司: 暂无信息 代理人: 暂无信息
地址: 463816 *** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语法标注 中文分词 字符串文件 词性标注 检索结果 检索数据 自然语言 网络客户端软件 预处理 标点 空格 计算机程序 计算机处理 网络客户端 词性分析 中文 加载 语句 转化
【说明书】:

中文语法标注是对自然语言进行计算机处理的计算机程序。该程序通过加载网络客户端中文分词软件(如中科院中文分词网络客户端软件)来获得中文分词词性标注文件;先对词性标注文件进行必要的预处理来获得特定形式的字符串文件,然后针对该字符串文件进行空格、标点、词性分析,转化为各种语句的检索数据;依据检索数据在语法标注库中获得检索结果,并把检索结果处理成语法标注文件,从而实现语法标注。

技术领域

发明涉及一种计算机程序,是对自然语言进行计算机处理的计算机程序。

背景技术

在对自然语言进行处理的计算机中文分词程序中(例如中科院中文分词),中文分词程序可以把中文分解成词,并对词进行词性标注。但这些还不够,要是在词性标注的同时也有语法标注就更好了。本计算机程序的目的是在中文分词程序的基础上进一步实现语法标注,即在中文词性标注的同时也有语法标注。

发明内容

本计算机程序的技术方案概括的说是在中文分词词性标注文件的基础上,经过必要的预处理获得文件特定形式后,通过对空格、标点、词性进行解析转化为语句检索数据,然后在语法标注库中进行数据检索,并把检索结果处理成语法标注文件,从而实现对语句的语法标注。

附图说明:本发明包含以下附图。

图1为标志序号的有关概念及有关的标志序号数组图、图2为标志序号分类及类型编码规则图、图3 为一种冒号标志序号(数组为f00001[])的求解流程图、图4为冒号标志序号有关的映射函数图、图5为替换规则图、图6为标点符号函数图、图7为特别情况下标点符号替换函数图、图8为用数组记录特定字符的位置并用另一数组记录指定位置的一段字符长度流程图、图9为句点概念及句子类型图、图10为sw0 中的标点数组和句点映射函数s036yfun()图、图11为句内标点数量映射函数图、图12为sw0中词性数据图、图13为综合数组与词性映射函数图、图14为由数组prz036[]的数据转化类型简单形式的字符串str0a0程序流程图、图15为p004[],p005[],p006[]存储数据的方法示意图、图16为语法标注数字代码规则图、图 17为在字符串sw0中,用数组(p004[],p005[],p006[])存储字符串的类型特点数据流程图、图18为在字符串sw0中,组成一个新的语法标注字符串流程图。

本计算机程序是按照以下的编程顺序来实现的:

1.加载中文分词词性标注文件

中文分词词性标注文件的加载可以通过加载网络客户端中文分词软件(如中科院中文分词网络客户端软件)来获得。由于中文分词客户端软件需要授权许可才能正常运行,采用一些中文分词词性标注文件片段也可验证本计算机程序是不是能正确运行。

2.对中文分词词性标注文件(字符串文件str)进行规范化预处理

在中文分词词性标注文件(字符串文件str)中,词语原文与词性标注是通过分格符“/”分开的,同时由于存在文件格式也可能有很多空格“”。我们用“~/”代替“//”或“///”;用“$”代替“”;用“$$”代替“”;用“$$$”代替“”;用“$1$”代替4个空格“”;用“$2$”代替5个空格“”;用“$3$”代替6个空格“”;用“$4$”代替7个空格“”;用“$5$”代替8个空格“”;用“$6$”代替9个空格“”;用“$7$”代替10个空格“”;超过10个空格也用“$7$”替换。经过这样的处理,中文分词词性标注文件(字符串文件str)中,就不再有重复的“/”,同时空格的替换为定量区分句子停顿和文件格式创造了条件。由于这种处理影响了计算机对原文件的存储,还需要通过插入“$”的方式对字符串文件str的结尾进行规范化调整。另外在中文分词词性标注文件的最前面插入了标志语句 (yyy/n。/wj),它的插入是为了应对后面的程序在获得类型细分形式的字符串(str0i0)时,字符串的第一个词性字符不能细分的缺点而特设的与中文分词词性标注文件不相干的无关紧要的句子。(注:中文分词词性标注文件就是该计算机程序要分析的字符串文件str)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于节金旗,未经节金旗许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711125822.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top