[发明专利]基于在线教育大数据的深度学习样本标注方法有效

专利信息
申请号: 201711469133.3 申请日: 2017-12-29
公开(公告)号: CN108170811B 公开(公告)日: 2022-07-15
发明(设计)人: 熊利;陈靖;李晓清 申请(专利权)人: 北京大生在线科技有限公司
主分类号: G06F16/48 分类号: G06F16/48;G06F16/45;G06K9/62
代理公司: 北京双收知识产权代理有限公司 11241 代理人: 陈泉
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于在线教育大数据的深度学习样本标注方法,输入需标注的在线教育数据M个,展示N个数据,对展示的N个数据进行标注;当M大于N*展示次数时,从余下的M‑N*展示次数中随机选取N个数据,不足N时,选取余下的全部数据;当M小于N*展示次数时,重新从M中随机N个数据,展示次数置为1;所有数据被标注之和大于M的J倍数之后,取数据被标注的次数大于K为符合该分类的有效数据;得到不同类别数据的分类库。本发明基于在线教育大数据的深度学习样本标注方法,提高了在线教育数据的识别,提升了用户满意度,提升用户体验,避免了个人的主观性,释放了单个重复劳动的枯燥性,也极大的方便了所有标注的用户。
搜索关键词: 基于 在线教育 数据 深度 学习 样本 标注 方法
【主权项】:
1.一种基于在线教育大数据的深度学习样本标注方法,其特征在于,

输入需标注的在线教育数据M个,保证输入的数据为同一种类别;

将需标注的在线教育数据存储到数据库中;

通过在线教育数据标注系统展示需要标注的N个数据;N个数据来自于数据库中未标注的随机数据;

对展示的N个数据进行标注;

当M大于N*展示次数时,从余下的M‑N*展示次数中随机选取N个数据,不足N时,选取余下的全部数据;

当M小于N*展示次数时,重新从M中随机N个数据,展示次数置为1;

所有数据被标注之和大于M的J倍数之后,可进行分类;

对每一个分类中数据被标注次数从高到低排序;

取数据被标注的次数大于K为符合该分类的有效数据;

得到不同类别数据的分类库。

2.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:对展示的N个数据中的一个数据进行标注。

3.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:每次展示数据的数量N根据显示设备确定。

4.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:K值大于60。

5.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:J值大于100。

6.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:在线教育数据包括音频、视频或图片。

7.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:M个数据全部类型完成了一次展示步骤如下:

步骤s100,输入需标注的在线教育数据M个,保证输入的数据为同一种类别;

步骤s101,将数据存储于数据库,设定数据标注类型,数据类型为A、B、C、……K;

步骤s102,判别A类型的数据是否展示完毕,展示完毕执行步骤s202,否则执行步骤s103;

步骤s103,A类展示计数器n1置零;

步骤s104,从M‑N*n1个数据中随机选取N个数据进行展示;

步骤s105,对展示的N个数据中一个数据进行标注;

步骤s106,展示计数器n1=n1+1;

步骤s107,判断M是否大于N*n1,如果M大于N*n1,执行步骤s104;如果M不大于N*n1,执行步骤s108;

步骤s108,选取余下的全部数据进行展示,对其中的一个数据进行标注,执行步骤s102;

步骤s202,判别A类型的数据是否展示完毕,展示完毕执行步骤s302,否则执行步骤s203;

步骤s203,B类展示计数器n2置零;

步骤s204,从M‑N*n2个数据中随机选取N个数据进行展示;

步骤s205,对展示的N个数据中一个数据进行标注;

步骤s206,展示计数器n1=n2+1;

步骤s207,判断M是否大于N*n2,如果M大于N*n2,执行步骤s104;如果M不大于N*n2,执行步骤s208;

步骤s208,选取余下的全部数据进行展示,对其中的一个数据进行标注,执行步骤s202;

步骤s302,判别A类型的数据是否展示完毕,展示完毕执行步骤s309,否则执行步骤s303;

步骤s303,C类展示计数器n3置零;

步骤s304,从M‑N*n3个数据中随机选取N个数据进行展示;

步骤s305,对展示的N个数据中一个数据进行标注;

步骤s306,展示计数器n1=n3+1;

步骤s307,判断M是否大于N*n3,如果M大于N*n3,执行步骤s104;如果M不大于N*n3,执行步骤s308;

步骤s308,选取余下的全部数据进行展示,对其中的一个数据进行标注,执行步骤s302;

步骤s309,数据库M个数据中的全部类型完成了一次展示,结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大生在线科技有限公司,未经北京大生在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711469133.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top