[发明专利]基于在线教育大数据的深度学习样本标注方法有效
申请号: | 201711469133.3 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108170811B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 熊利;陈靖;李晓清 | 申请(专利权)人: | 北京大生在线科技有限公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48;G06F16/45;G06K9/62 |
代理公司: | 北京双收知识产权代理有限公司 11241 | 代理人: | 陈泉 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于在线教育大数据的深度学习样本标注方法,输入需标注的在线教育数据M个,展示N个数据,对展示的N个数据进行标注;当M大于N*展示次数时,从余下的M‑N*展示次数中随机选取N个数据,不足N时,选取余下的全部数据;当M小于N*展示次数时,重新从M中随机N个数据,展示次数置为1;所有数据被标注之和大于M的J倍数之后,取数据被标注的次数大于K为符合该分类的有效数据;得到不同类别数据的分类库。本发明基于在线教育大数据的深度学习样本标注方法,提高了在线教育数据的识别,提升了用户满意度,提升用户体验,避免了个人的主观性,释放了单个重复劳动的枯燥性,也极大的方便了所有标注的用户。 | ||
搜索关键词: | 基于 在线教育 数据 深度 学习 样本 标注 方法 | ||
输入需标注的在线教育数据M个,保证输入的数据为同一种类别;
将需标注的在线教育数据存储到数据库中;
通过在线教育数据标注系统展示需要标注的N个数据;N个数据来自于数据库中未标注的随机数据;
对展示的N个数据进行标注;
当M大于N*展示次数时,从余下的M‑N*展示次数中随机选取N个数据,不足N时,选取余下的全部数据;
当M小于N*展示次数时,重新从M中随机N个数据,展示次数置为1;
所有数据被标注之和大于M的J倍数之后,可进行分类;
对每一个分类中数据被标注次数从高到低排序;
取数据被标注的次数大于K为符合该分类的有效数据;
得到不同类别数据的分类库。
2.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:对展示的N个数据中的一个数据进行标注。3.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:每次展示数据的数量N根据显示设备确定。4.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:K值大于60。5.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:J值大于100。6.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:在线教育数据包括音频、视频或图片。7.根据权利要求1所述基于在线教育大数据的深度学习样本标注方法,其特征在于:M个数据全部类型完成了一次展示步骤如下:步骤s100,输入需标注的在线教育数据M个,保证输入的数据为同一种类别;
步骤s101,将数据存储于数据库,设定数据标注类型,数据类型为A、B、C、……K;
步骤s102,判别A类型的数据是否展示完毕,展示完毕执行步骤s202,否则执行步骤s103;
步骤s103,A类展示计数器n1置零;
步骤s104,从M‑N*n1个数据中随机选取N个数据进行展示;
步骤s105,对展示的N个数据中一个数据进行标注;
步骤s106,展示计数器n1=n1+1;
步骤s107,判断M是否大于N*n1,如果M大于N*n1,执行步骤s104;如果M不大于N*n1,执行步骤s108;
步骤s108,选取余下的全部数据进行展示,对其中的一个数据进行标注,执行步骤s102;
步骤s202,判别A类型的数据是否展示完毕,展示完毕执行步骤s302,否则执行步骤s203;
步骤s203,B类展示计数器n2置零;
步骤s204,从M‑N*n2个数据中随机选取N个数据进行展示;
步骤s205,对展示的N个数据中一个数据进行标注;
步骤s206,展示计数器n1=n2+1;
步骤s207,判断M是否大于N*n2,如果M大于N*n2,执行步骤s104;如果M不大于N*n2,执行步骤s208;
步骤s208,选取余下的全部数据进行展示,对其中的一个数据进行标注,执行步骤s202;
步骤s302,判别A类型的数据是否展示完毕,展示完毕执行步骤s309,否则执行步骤s303;
步骤s303,C类展示计数器n3置零;
步骤s304,从M‑N*n3个数据中随机选取N个数据进行展示;
步骤s305,对展示的N个数据中一个数据进行标注;
步骤s306,展示计数器n1=n3+1;
步骤s307,判断M是否大于N*n3,如果M大于N*n3,执行步骤s104;如果M不大于N*n3,执行步骤s308;
步骤s308,选取余下的全部数据进行展示,对其中的一个数据进行标注,执行步骤s302;
步骤s309,数据库M个数据中的全部类型完成了一次展示,结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大生在线科技有限公司,未经北京大生在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711469133.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于动态行为的广告检测方法
- 下一篇:一种数据过滤方法及设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置