[发明专利]倒排参考句型语言分析方法在审
申请号: | 200810005364.3 | 申请日: | 2008-01-28 |
公开(公告)号: | CN101499056A | 公开(公告)日: | 2009-08-05 |
发明(设计)人: | 徐文新 | 申请(专利权)人: | 徐文新 |
主分类号: | G06F17/20 | 分类号: | G06F17/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 330031江西省南昌市红谷滩*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 倒排参考句型语言分析方法是一种基于参考句型的语言分析方法,可用于自然语言处理、智能信息处理等方面。方法是建立语言的基本句型S的数据库,包含处理信息,给出S的字符元数k;给出字段j;句型或j的地址为d、或给出句型编号n。以所有字符元Pi作为关键词,对每个字符元Pi,列出包含该字符元Pi的S或其j值的地址d、或编号n,得到倒排表。设P为需要分析的句子T的字符元,根据倒排表P后的d、或n,对数据库相应S的j进行累计标示,得到各基本句型S的j值。j=k的句型S为T的参考句型,参照这些句型的相关信息对T进行处理,一般优先参考j即k值大的句型,但应考虑其它因素。如果S和T中有重复字符元,情况会相对复杂。 | ||
搜索关键词: | 参考 句型 语言 分析 方法 | ||
【主权项】:
1. 一种语言分析方法,其特征在于,包括以下步骤:a. 建立某种语言的基本句型(含词语搭配、短语、词组、词语,下同)S的数据库,给出处理信息;给出各基本句型的字符元数k、或给出剔除重复后的字符元数h、或同时给出k和h、或给出k和字符元重复次数g、或给出h和g、或给出k和h和g;给出j;句型或j的地址为d,或给出句型编号n;b. 列出该语言此种应用的所有字符元Pi(i=1、2、3…w),对每个字符元Pi,均列出包含该字符元Pi的所有基本句型或j的地址d,或句型编号n,得出倒排表;c. 设需要分析的句子为T,用T的字符元Pr(i=1、2、3…m),根据倒排表Pr的d,或n,对基本句型数据库相应记录的j进行累计标示,得到各基本句型S的j值;d. 通过比较各句型S的j与k、h或者以及g的大小,筛选出T包含、可能包含其全部字符元、部分字符元的S,对S与T的字符元进行比较,剔除不合要求的S,一般优先选择k或h或j值大的句型作为基础句型,参照这些句型对T进行分析处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐文新,未经徐文新许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810005364.3/,转载请声明来源钻瓜专利网。
- 上一篇:扬声器组件
- 下一篇:太阳能野外多功能器具