[发明专利]倒排参考句型语言分析方法在审

专利信息
申请号: 200810005364.3 申请日: 2008-01-28
公开(公告)号: CN101499056A 公开(公告)日: 2009-08-05
发明(设计)人: 徐文新 申请(专利权)人: 徐文新
主分类号: G06F17/20 分类号: G06F17/20
代理公司: 暂无信息 代理人: 暂无信息
地址: 330031江西省南昌市红谷滩*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要: 倒排参考句型语言分析方法是一种基于参考句型的语言分析方法,可用于自然语言处理、智能信息处理等方面。方法是建立语言的基本句型S的数据库,包含处理信息,给出S的字符元数k;给出字段j;句型或j的地址为d、或给出句型编号n。以所有字符元Pi作为关键词,对每个字符元Pi,列出包含该字符元Pi的S或其j值的地址d、或编号n,得到倒排表。设P为需要分析的句子T的字符元,根据倒排表P后的d、或n,对数据库相应S的j进行累计标示,得到各基本句型S的j值。j=k的句型S为T的参考句型,参照这些句型的相关信息对T进行处理,一般优先参考j即k值大的句型,但应考虑其它因素。如果S和T中有重复字符元,情况会相对复杂。
搜索关键词: 参考 句型 语言 分析 方法
【主权项】:
1. 一种语言分析方法,其特征在于,包括以下步骤:a. 建立某种语言的基本句型(含词语搭配、短语、词组、词语,下同)S的数据库,给出处理信息;给出各基本句型的字符元数k、或给出剔除重复后的字符元数h、或同时给出k和h、或给出k和字符元重复次数g、或给出h和g、或给出k和h和g;给出j;句型或j的地址为d,或给出句型编号n;b. 列出该语言此种应用的所有字符元Pi(i=1、2、3…w),对每个字符元Pi,均列出包含该字符元Pi的所有基本句型或j的地址d,或句型编号n,得出倒排表;c. 设需要分析的句子为T,用T的字符元Pr(i=1、2、3…m),根据倒排表Pr的d,或n,对基本句型数据库相应记录的j进行累计标示,得到各基本句型S的j值;d. 通过比较各句型S的j与k、h或者以及g的大小,筛选出T包含、可能包含其全部字符元、部分字符元的S,对S与T的字符元进行比较,剔除不合要求的S,一般优先选择k或h或j值大的句型作为基础句型,参照这些句型对T进行分析处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐文新,未经徐文新许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810005364.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top