[发明专利]汉语文本中词及词属性自动索引和检索的方法无效
申请号: | 03156538.7 | 申请日: | 2003-09-08 |
公开(公告)号: | CN1595399A | 公开(公告)日: | 2005-03-16 |
发明(设计)人: | 宋柔;樊太志;罗智勇;荀恩东 | 申请(专利权)人: | 北京语言大学语言信息处理研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种汉语文本中词及词属性自动索引和检索方法。该方法的主要特征是从一个用户词库出发,对词属性编码并将用户词库自动转为机内词库;使用机内词库对用户语料库自动切词,生成用户语料库切词结果,进而自动生成词索引和词属性索引;使用用户检索条件,借助词属性索引、词索引和用户语料库切词结果对用户语料库进行自动检索,得到检索结果。本发明要解决的技术问题是:基于任何词表、任何词属性体系,对任何生语料进行词和词属性的自动索引和检索。使用本发明,在做词及词属性检索的工作中可以免去语料库标注的巨大的工作量,进而大大节省语言研究、语言教学、词典编纂人员的人力,大大提高他们的工作效率。 | ||
搜索关键词: | 汉语 文本 中词 属性 自动 索引 检索 方法 | ||
【主权项】:
1.一种汉语文本中词及词属性自动索引和检索的方法,其特征在于以下步骤:(a)从一个用户词库出发,对词属性编码并将用户词库自动转为机内词库;(b)使用机内词库对用户语料库自动切词,生成用户语料库切词结果,进而生成词索引和词属性索引;(c)使用用户检索条件,借助词属性索引、词索引和用户语料库切词结果对用户语料库进行检索,得到检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学语言信息处理研究所,未经北京语言大学语言信息处理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03156538.7/,转载请声明来源钻瓜专利网。