[发明专利]词性标注模型训练装置、词性标注系统及其方法有效
申请号: | 200810085463.7 | 申请日: | 2008-03-19 |
公开(公告)号: | CN101539907A | 公开(公告)日: | 2009-09-23 |
发明(设计)人: | 胡长建;赵凯;邱立坤 | 申请(专利权)人: | 日电(中国)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 罗松梅 |
地址: | 100007北京市东城区东四十*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种词性标注模型训练装置,包括:直接成分分析单元,用于对词进行直接成分分析,以获得直接成分、其属性以及位置关系;转换单元,用于将直接成分分析的结果转换为训练数据;机器学习单元,用于对转换的训练数据进行机器学习,从而生成词性标注模型。以及涉及一种词性标注模型训练方法。以及一种词性标注系统及其方法,系统包括:词性标注模型训练装置,用于通过对词典中的词执行直接成分分析,以训练生成词性标注模型;以及基于模型的词性标注装置,用于利用词性标注模型对未登录词进行词性标注。根据本发明的系统,可以根据现有的文本信息,对未登录词的词性进行准确标注,提高了文本信息处理的效率。 | ||
搜索关键词: | 词性 标注 模型 训练 装置 系统 及其 方法 | ||
【主权项】:
1.一种词性标注模型训练装置,包括:直接成分分析单元,用于对词进行直接成分分析,以获得直接成分、其属性以及位置关系;转换单元,用于将直接成分分析的结果转换为训练数据;机器学习单元,用于对转换的训练数据进行机器学习,从而生成词性标注模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810085463.7/,转载请声明来源钻瓜专利网。