[发明专利]自动问答系统中的问题聚类处理方法及装置有效
申请号: | 201611002092.2 | 申请日: | 2016-11-14 |
公开(公告)号: | CN107656948B | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 王健宗;袁威强;韩茂琨;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种自动问答系统中的问题聚类处理方法及装置。该方法包括:接收编写人员输入的聚类请求;基于聚类请求从未回复问题数据库中获取待聚类问题集;采用文本特征提取算法对待聚类问题集进行特征提取,输出问题特征集;判断问题特征集是否符合预设分裂条件;若符合预设分裂条件,则采用分割聚类算法对问题特征集进行分割聚类,输出至少两个问题特征子集;将问题特征子集更新为问题特征集,并判断问题特征集是否符合预设分裂条件;若不符合预设分裂条件,则将问题特征集作为聚类类簇输出。该自动问答系统中的问题聚类处理方法及装置中,可对待聚类问题集自动聚类,帮助编写人员了解问题咨询需求,提高编写的问答对的覆盖面。 | ||
搜索关键词: | 自动 问答 系统 中的 问题 处理 方法 装置 | ||
【主权项】:
1.一种自动问答系统中的问题聚类处理方法,其特征在于,包括:接收编写人员输入的聚类请求;基于所述聚类请求从未回复问题数据库中获取待聚类问题集,所述待聚类问题集包括至少一个待聚类问题;采用文本特征提取算法对所述待聚类问题集进行特征提取,输出问题特征集,所述问题特征集包括至少一个问题特征;判断所述问题特征集是否符合预设分裂条件;若符合预设分裂条件,则采用分割聚类算法对所述问题特征集进行分割聚类,输出至少两个问题特征子集;将所述问题特征子集更新为问题特征集,并判断所述问题特征集是否符合预设分裂条件;若不符合预设分裂条件,则将所述问题特征集作为聚类类簇输出,根据所述聚类类簇设计新的问答对,并将所述问答对存储在常问问题库中;所述判断所述问题特征集是否符合预设分裂条件,包括:判断所述问题特征集能否基于至少两个分裂聚类中心分割成至少两个问题特征子集,以使问题特征集中所有点到原始聚类中心的平均距离大于每一问题特征子集中所有点到所述分裂聚类中心的平均距离;若能,则符合预设分裂条件;若否,则不符合预设分裂条件;或者,判断所述问题特征集的问题特征数量是否大于预设分裂数量,若是,则符合预设分裂条件;若否,则不符合预设分裂条件;所述预设分裂数量为未回复问题数据库中所有问题数量的平方根。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611002092.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种大型板材加工模具
- 下一篇:一种分布式数据库的联合访问方法