[发明专利]结合句法结构关系和领域特征的领域问题分类方法无效
申请号: | 200810058667.1 | 申请日: | 2008-07-10 |
公开(公告)号: | CN101320374A | 公开(公告)日: | 2008-12-10 |
发明(设计)人: | 余正涛;孟祥燕;韩露;毛存礼;车文刚 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 昆明正原专利代理有限责任公司 | 代理人: | 徐玲菊 |
地址: | 650093云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种结合句法结构关系与领域特征的领域问题分类方法,包括下列步骤:领域术语收集,特定领域问题分类体系定义,对问题进行句法结构分析,提取句子主干,结合句子主干和领域词汇项作为问题的分类特征,采用改进贝叶斯分类算法构建问题分类模型,特定领域问题分类训练语料库和测试语料库构建,特定领域问题分类器构建。由于问题分类是问答系统中一个非常重要的步骤,是制定答案抽取策略和定位答案的关键因素,因此通过本发明,即在句法结构分析的基础上,结合领域特点,选取句子主干和领域词汇作为分类特征,采用改进贝叶斯分类学习算法,构造问句分类模型,并在云南旅游领域进行问题分类实验,结果表明该方法有效,提高了领域问题分类的准确率,从而能够高效,快速、准确地为用户提供咨询服务。 | ||
搜索关键词: | 结合 句法 结构 关系 领域 特征 问题 分类 方法 | ||
【主权项】:
1.结合句法结构关系和领域特征的领域问题分类方法,其特征在于:(1)领域术语收集:针对云南旅游领域,人工收集整理出领域术语;(2)特定领域问题分类体系定义:针对旅游领域,定义了5个大类,23个小类的问题分类体系;(3)对问题进行句法结构分析,提取句子主干:对于一个句子,定义句子的主谓宾为句子主干,其他词项为句子附属成分;(4)结合句子主干和领域词汇项作为问题的分类特征:为了利用领域知识特点,引入领域术语,结合句子主干和领域词汇项作为问题的分类特征;(5)采用改进贝叶斯分类算法构建问题分类模型:结合问题分类特点,改进贝叶斯学习算法并应用于领域问题分类;(6)特定领域问题分类训练语料库和测试语料库构建:针对旅游领域,构建了云南旅游领域训练语料库和测试语料库;(7)特定领域问题分类器构建:采用Web方式实现云南旅游领域问题分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810058667.1/,转载请声明来源钻瓜专利网。
- 上一篇:板式多功能太阳能集热器
- 下一篇:快速循环式太阳能空气集热器