[发明专利]一种汉语框架网标注时框架排歧方法及装置有效
申请号: | 201010264377.X | 申请日: | 2010-08-20 |
公开(公告)号: | CN102375808A | 公开(公告)日: | 2012-03-14 |
发明(设计)人: | 李茹;刘海静;李双红;高俊杰 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种汉语框架网标注汉语句子时的框架排歧方法及装置,该方法包括:选择训练语料,对训练语料中的句子进行依存句法分析;将框架排歧任务作为标注任务,选择树结构条件随机场模型为标注模型,并为建立的标注模型选择特征;根据所述选择的特征利用训练语料对所述标注模型进行训练,得到合适的标注模型;将待识别句子的词性标注信息以及依存句法关系提交训练后的标注模型,得到待识别句子中目标词的所属框架。 | ||
搜索关键词: | 一种 汉语 框架 标注 方法 装置 | ||
【主权项】:
一种汉语框架网标注汉语句子时框架排歧的方法,其特征在于,包括:当应用汉语框架网标注待识别句子的框架信息时,选择训练语料,该训练语料包含待识别句子中出现的目标词激起的所有框架的句子实例,并且包括每个句子实例的框架语义信息;对所述句子实例进行依存句法分析,得到每个句子实例的依存句法关系;选择树结构条件随机场T‑CRF模型作为框架排歧任务的标注模型,并利用所述句子实例的词法信息、依存句法关系和框架语义信息进行标注模型的训练,得到特定参数的标注模型;对待识别句子进行分词、词性标注及依存句法分析,得到待识别句子的词法信息和依存句法关系;将待识别句子的词法信息和依存句法关系提交所述特定参数的标注模型,得到待识别句子中目标词的所属框架。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010264377.X/,转载请声明来源钻瓜专利网。