[发明专利]一种问题分类方法及装置在审
申请号: | 201510530887.X | 申请日: | 2015-08-26 |
公开(公告)号: | CN105183808A | 公开(公告)日: | 2015-12-23 |
发明(设计)人: | 李寿山;张栋;周国栋 | 申请(专利权)人: | 苏州大学张家港工业技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215600 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问题 分类 方法 装置 | ||
1.一种问题分类方法,其特征在于,包括:
将待分类问题输入至预先建立的分类器中,所述分类器为对多组已知类别的训练样本集进行训练得到的,包括主观类别、客观类别分别在所述训练样本集中出现的概率以及每个特征属性对主观类别、客观类别的条件概率;
通过所述分类器分别确定所述待分类问题的每个特征属性对主观类别以及客观类别的条件概率;
分别计算所述待分类问题属于主观类别的第一后验概率以及属于客观类别的第二后验概率;
将所述第一后验概率以及第二后验概率中较大值对应的类别作为所述待分类问题所属的类别。
2.如权利要求1所述的问题分类方法,其特征在于,所述分别计算所述待分类问题属于主观类别的第一后验概率以及属于客观类别的第二后验概率包括:
分别计算主观类别在所述训练样本集中出现的概率与所述待分类问题对对应类别的条件概率的第一乘积,以及客观类别在所述训练样本集中出现的概率与所述待分类问题对客观类别的条件概率的第二乘积;
所述将所述第一后验概率以及第二后验概率中较大值对应的类别作为所述待分类问题所属的类别包括:
将所述第一乘积以及第二乘积中较大值对应的类别作为所述待分类问题所属的类别。
3.如权利要求1所述的问题分类方法,其特征在于,所述特征属性为问题中的一元词特征或一元与二元的组合特征。
4.如权利要求1至3任一项所述的问题分类方法,其特征在于,预先建立所述分类器包括步骤:
抓取多个问题;
通过人工标注的方法对所抓取语料进行主客观类别的标注,作为训练样本集;
计算主观类别、客观类别分别在所述训练样本集中出现的概率以及每个特征属性对主观类别、客观类别的条件概率。
5.如权利要求4所述的问题分类方法,其特征在于,所述抓取多个问题之后还包括:
将抓取到的问题进行过滤后,作为抓取语料。
6.一种问题分类装置,其特征在于,包括:
输入模块,用于将待分类问题输入至预先建立的分类器中,所述分类器为对多组已知类别的训练样本集进行训练得到的,包括主观类别、客观类别分别在所述训练样本集中出现的概率以及每个特征属性对主观类别、客观类别的条件概率;
确定模块,用于通过所述分类器分别确定所述待分类问题的每个特征属性对主观类别以及客观类别的条件概率;
计算模块,用于分别计算所述待分类问题属于主观类别的第一后验概率以及属于客观类别的第二后验概率;
分类模块,用于将所述第一后验概率以及第二后验概率中较大值对应的类别作为所述待分类问题所属的类别。
7.如权利要求6所述的问题分类装置,其特征在于,所述计算模块用于分别计算所述待分类问题属于主观类别的第一后验概率以及属于客观类别的第二后验概率包括:
所述计算模块具体用于分别计算主观类别在所述训练样本集中出现的概率与所述待分类问题对对应类别的条件概率的第一乘积,以及客观类别在所述训练样本集中出现的概率与所述待分类问题对客观类别的条件概率的第二乘积;
所述分类模块用于将所述第一后验概率以及第二后验概率中较大值对应的类别作为所述待分类问题所属的类别包括:
所述分类模块具体用于将所述第一乘积以及第二乘积中较大值对应的类别作为所述待分类问题所属的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学张家港工业技术研究院,未经苏州大学张家港工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510530887.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于手写输入的搜索方法及装置
- 下一篇:外墙用耐沾污涂料及其制备方法