[发明专利]一种人工智能学习库的标记数据生成方法在审
申请号: | 201910902629.8 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110647712A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 廖律超;郑雨馨;邹复民;潘正祥;李升波;杨海燕;郭峰;蔡祈钦;刘洁锐;陈必俊 | 申请(专利权)人: | 福建工程学院 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F21/31;G06N20/00 |
代理公司: | 33246 浙江千克知识产权代理有限公司 | 代理人: | 裴金华 |
地址: | 350118 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 反馈信息 人工智能 标记数据 验证信息 用户标记 人工智能技术 用户验证信息 登陆网站 输入验证 数据标记 自定义 网站 登陆 文本 语音 学习 返回 图片 | ||
本发明提供了一种人工智能学习库的标记数据生成方法,属于人工智能技术领域。一种人工智能学习库的标记数据生成方法,包括以下步骤:步骤S1、随机发给多个用户验证信息让用户标记;步骤S2、用户标记验证信息后得到多个反馈信息a,反馈信息a出现的次数k与用户个数n的比值为P(t),即P(a)=k/n,并将得到的P(a)值从大到小排列;步骤S3、判断n与N,若n>N,则将max P(a)对应的反馈信息a标记为关键词t,否则,返回步骤S1,N为自定义阈值。将未标记的数据(图片,语音,文本等)作为网站或平台的登陆验证信息,用户在登陆网站等操作是通过输入验证信息完成数据标记。
技术领域
本发明涉及人工智能技术领域,具体涉及一种人工智能学习库的标记数据生成方法。
背景技术
在人工智能领域中,通常使用的学习方法是监督学习,监督学习是将大量训练数据打上标记,机器通过学习后能够捕捉到这些具有相同标注的数据的共同特征,从而可以识别机器没有见过的测试数据,这些用于训练和测试的数据都是某种或多种属性的标记数据。数据的标记是机器学习中非常重要的一环,目前标记数据主要通过数据标记从业人员为数据打上标签的方式生成,标记工作重复枯燥。
发明内容
本发明的目的是提供一种人工智能学习库的标记数据生成方法,将未标记的数据(图片,语音,文本等)作为网站或平台的登陆验证信息,用户在登陆网站等操作是通过输入验证信息完成数据标记。
本发明的上述技术目的是通过以下技术方案实现的:一种人工智能学习库的标记数据生成方法,包括以下步骤:
步骤S1、随机发给多个用户验证信息让用户标记;
步骤S2、用户标记验证信息后得到多个反馈信息a,反馈信息a出现的次数k与用户个数n的比值为P(a),即P(a)=k/n,并将得到的P(a)值从大到小排列;
步骤S3、判断n与N,若n>N,则将max P(a)对应的反馈信息a标记为关键词t,否则,返回步骤S1,N为自定义阈值。
验证信息是用来区别用户是人还是程序的一种方法,是用户在网站进行登陆、注册或支付等操作之前的一种安全措施。在本发明中,验证信息的形式可以是给定一张图片,一段语音或一段文字,让用户进行场景或者语境描述,给出主要的关键字。所述验证信息的标记是指用户描述所述验证信息的内容,所述验证信息设有关键词t,所述验证信息中至少含有一个关键词t,所述关键词t用于判断用户描述的是否正确。N为自设定阈值,保证样本数量足够大,当超过N个人对该验证信息进行关键词描述时,选择P(a)最高的反馈信息a,将其标记为关键词t并作为验证信息的标记,P(a)表示n个候选人在对某一验证信息进行描述时,验证信息标记得到反馈信息a(a为a1,a2,a3…),反馈信息a出现的次数k(k为k1,k2,k3…)与用户个数n的比值为P(a),即P(a)=k/n。
作为本发明的优选,用户在注册,登陆,支付时,发送验证信息。
作为本发明的优选,验证信息为图片,语音或文字。
作为本发明的优选,对用户进行置信度评估,所述置信度评估是通过用户历史输入验证信息的情况来找出适合进行数据标注的用户,验证信息是有标记的,用户在网站输入验证信息的次数达到一定阈值且用户输入验证信息的正确率达到一定阈值,用户置信度高,列为候选人。
作为本发明的优选,用户成为候选人后,发送给候选人标记的验证信息是随机的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建工程学院,未经福建工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910902629.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:访问入口配置的方法及装置
- 下一篇:一种智慧旅游景区资源池融合系统