[发明专利]问答语料库的问题分类方法及装置有效
申请号: | 201611036159.4 | 申请日: | 2016-11-14 |
公开(公告)号: | CN107784048B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 韩茂琨;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种问答语料库的问题分类方法及装置。该问答语料库的问题分类方法,包括:采用预设问题分类体系对问答语料库中的每一问题进行问题类型标注,形成已标注问题;对已标注问题进行问题类型和问题内容抽取,获取原始数据;采用特征提取工具对原始数据进行特征提取,以获取命名实体识别、词性标注和句子组块对应的三组原始分类特征;对三组原始分类特征进行线性组合,形成特征数据集;采用线性核的支持向量机对特征数据集进行分类,输出分类结果。该问答语料库的问题分类方法中,仅需对问题进行问题类型标注,无需耗费大量的人力成本进行焦点词标注,即可实现对问答语料库中的问题进行分类,分类效率高且成本低。 | ||
搜索关键词: | 问答 语料库 问题 分类 方法 装置 | ||
【主权项】:
一种问答语料库的问题分类方法,其特征在于,包括:采用预设问题分类体系对问答语料库中的每一问题进行问题类型标注,形成已标注问题;对所述已标注问题进行问题类型和问题内容抽取,获取原始数据;采用特征提取工具对所述原始数据进行特征提取,以获取命名实体识别、词性标注和句子组块对应的三组原始分类特征;对所述三组原始分类特征进行线性组合,形成特征数据集;采用线性核的支持向量机对所述特征数据集进行分类,输出分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611036159.4/,转载请声明来源钻瓜专利网。