[发明专利]一种大数据样本序列标注方法、系统、终端及可存储介质在审
申请号: | 202210792213.7 | 申请日: | 2022-07-07 |
公开(公告)号: | CN115186682A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 田笔挥;杨闯;倪祥福 | 申请(专利权)人: | 深圳市智联九九通讯技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/253;G06N3/04 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 张桂钦 |
地址: | 518101 广东省深圳市宝安区新安街道兴东社区71区南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 样本 序列 标注 方法 系统 终端 存储 介质 | ||
1.一种大数据样本序列标注方法,其特征在于,包括:
构建神经学习网络模型;
获取学科科目相关的数据样本;
判断所述数据样本是否满足预设的样本要求;
若所述数据样本不满足所述样本要求,则获取下一所述数据样本;
若所述数据样本满足所述样本要求,则将所述数据样本导入所述神经网络模型;
将所述数据样本分解成多个数据段落;
判断所述数据段落是否符合预设的特殊标注规则;
若所述数据段落符合所述特殊标注规则,则对所述数据段落进行特殊标注;
若所述数据段落不符合所述特殊标注规则,则对所述数据段落进行常规标注。
2.根据权利要求1所述的一种大数据样本序列标注方法,其特征在于,所述判断所述数据样本是否满足预设的样本要求的具体步骤包括:
获取所述学科科目的科目名称;
判断所述科目名称是否为预设的目标科目名称;
若所述科目名称与所述目标科目名称一致,则判定所述数据样本满足所述样本要求;
若所述科目名称不是所述目标科目名称,则判定所述数据样本不满足所述样本要求。
3.根据权利要求1所述的一种大数据样本序列标注方法,其特征在于,所述将所述数据样本分解成多个数据段落的具体步骤包括:
获取所述数据样本内容;
按预设的分解规则,判断所述数据内容中是否存在预设的目标符号;
若所述数据内容中存在所述目标符号,则获取目标符号位置;
基于所述分解规则以及所述目标符号位置,将所述数据样本分解成多个数据段落。
4.根据权利要求3所述的一种大数据样本序列标注方法,其特征在于,所述判断所述数据段落是否符合预设的特殊标注规则的具体步骤包括:
基于所述数据样本内容,获取数据段落内容;
基于所述数据段落内容,判断所述数据段落中是否存在预设的特殊用法;
若所述数据段落中存在预设的特殊用法,则判定所述数据段落符合所述特殊标注规则。
5.根据权利要求4所述的一种大数据样本序列标注方法,其特征在于,所述特殊标注规则包括动词标注规则以及名词标注规则;所述若所述数据段落符合所述特殊标注规则,则对所述数据段落进行特殊标注的具体步骤包括:
判断所述数据段落是否符合所述动词标注规则或所述名词标注规则;
若所述数据段落符合所述动词标注规则,则对所述数据段落进行第一特殊标注;
若所述数据段落是否符合所述名词标注规则,则对所述数据段落进行第二特殊标注。
6.根据权利要求5所述的一种大数据样本序列标注方法,其特征在于,所述动词标注规则包括形容词用作动词规则以及名词用作动词规则;所述若所述数据段落符合所述动词标注规则,则对所述数据段落进行第一特殊标注的具体步骤包括:
若所述数据段落符合所述动词标注规则,则判断所述数据段落是否符合所述形容词用作动词规则;
若所述数据段落符合所述形容词用作动词规则,则将指定形容词标注为动词;
若所述数据段落不符合所述形容词用作动词规则,则将指定名词标注为动词。
7.根据权利要求5所述的一种大数据样本序列标注方法,其特征在于,所述名词标注规则包括形容词用作名词规则以及动词用作名词规则;所述若所述数据段落符合所述名词标注规则,则对所述数据段落进行第二特殊标注的具体步骤包括:
若所述数据段落符合所述名词标注规则,则判断所述数据段落是否符合所述形容词用作名词规则;
若所述数据段落符合所述形容词用作名词规则,则将指定形容词标注为名词;
若所述数据段落不符合所述形容词用作名词规则,则将指定动词标注为名词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市智联九九通讯技术有限公司,未经深圳市智联九九通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210792213.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置