[发明专利]基于众包的高效分类系统及其创建、使用方法在审
申请号: | 202010824572.7 | 申请日: | 2020-08-17 |
公开(公告)号: | CN112101419A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 李国良;李元丙;李建;冯建华 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 白雪静 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 高效 分类 系统 及其 创建 使用方法 | ||
1.一种基于众包的高效分类系统,其特征在于,包括:
学习模块,用于通过在线学习方法以及在在线学习方法中加入记忆窗口的拓展方法来学习类别权重分布;
优化模块,用于根据已有或所述学习模块学习到的所述学习类别权重,运用贪心算法逐层构建决策树,作为询问策略;
众包模块,用于生成所述优化模块中选择出的问题节点对应的众包问题,将所述众包问题发布到众包平台以收集聚合答案,实施所述询问策略。
2.根据权利要求1所述的基于众包的高效分类系统,其特征在于,
所述在线学习方法包括following-the-perturbed-leader方法,通过记录已完成对象的类别信息并融入指数分布的随机信息得到所述类别权重分布。
3.根据权利要求2所述的基于众包的高效分类系统,其特征在于,
在所述following-the-perturbed-leader方法中,增加一个记忆窗口,只有最近的在所述记忆窗口中完成的已完成对象的类别信息被保留。
4.根据权利要求1所述的基于众包的高效分类系统,其特征在于,
所述贪心算法针对当前的树形结构,选择出一个或多个问题节点,使得移除问题节点相关联的边后,形成的多个新的树形结构中具有最大权重的结构的权重在所有可能的选择中是最小的,选择出的所述问题节点整体作为决策树的节点,对应一个或多个众包问题,所述众包问题的选项作为分支导向形成各个新的树形结构。
5.根据权利要求4所述的基于众包的高效分类系统,其特征在于,所述众包问题为多选一问题,则所述问题节点在所述树形结构的内部节点中选取。
6.根据权利要求4所述的基于众包的高效分类系统,其特征在于,所述众包问题为多选一问题,移除所述问题节点相关联的边中,所述相关联的边为连接问题节点与其父节点的边以及所有连接问题节点与其子节点的边;
所述众包问题为是非判断问题,移除所述问题节点相关联的边中,所述相关联的边为连接问题节点与其父节点的边。
7.根据权利要求4所述的基于众包的高效分类系统,其特征在于,
所述众包问题的选项由移除操作后形成的多个新的树形结构对应构成;
所述众包问题为多选一问题,所述众包问题的选项由所述问题节点的各个子节点所在树形结构、问题节点自身、问题节点的父节点所在树形结构构成;
所述众包问题为是非判断问题,所述众包问题的选项由问题节点自身所在树形结构、问题节点的父节点所在树形结构构成。
8.根据权利要求1所述的基于众包的高效分类系统,其特征在于,
所述询问策略为在构建的所述决策树中,按照所述众包问题的答案自根节点从上到下最终到达叶节点即可得到分类结果的策略。
9.一种基于众包的高效分类系统的创建方法,其特征在于,包括以下步骤:
S11,定义分类成本和分类延迟;
S12,实现优化模块,对于给定的树形类别结构,基于类别权重分布以贪心算法构建决策树进而得到询问策略;
S13,实现众包模块,生成众包问题、与众包平台交互并收集聚合答案,实施询问策略;
S14,实现学习模块,通过在线学习方法学习类别权重分布。
10.一种基于众包的高效分类系统的使用方法,其特征在于,包括以下步骤:
S21,接受给定的树形类别结构和待分类的对象集,初始化并按照需要配置学习模块、优化模块和众包模块;
S22,所述优化模块构建初始状态下的决策树和询问策略;
S23,所述众包模块根据所述决策树生成众包问题并发布到众包平台上,待众包工作者完成后收集并聚合答案,实施所述询问策略;
S24,所述学习模块根据当前已完成对象的类别信息更新类别权重分布;
S25,所述优化模块根据更新后的类别权重分布构建新的决策树和询问策略;
S26,反复执行步骤S23-S25,直至确定所有待分类对象的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010824572.7/1.html,转载请声明来源钻瓜专利网。