[发明专利]数据更新的方法及装置在审
申请号: | 201710142462.0 | 申请日: | 2017-03-10 |
公开(公告)号: | CN106919706A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 徐骄 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
地址: | 510530 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 更新 方法 装置 | ||
1.一种数据更新的方法,其特征在于,包括:
获取数据样本中缺失属性和非缺失属性的第一出现率信息,所述数据样本包括包含缺失值的第一数据样本和未包含缺失值的第二数据样本,所述缺失属性为所述第一数据样本中缺失值对应的属性;
根据所述第一出现率信息计算所述缺失属性对应的各属性值的第二出现率信息,所述第二出现率信息为缺失属性对应的各属性值在所述第一数据样本中出现的出现率信息;
根据所述第二出现率信息确定与所述第一数据样本对应的填充值,并根据所述填充值更新所述第一数据样本。
2.根据权利要求1所述的方法,其特征在于,所述第一出现率信息包括缺失属性对应的各属性值在第二数据样本中的第一子出现率信息以及所述第一数据样本中各非缺失属性的属性值在第二数据样本中以缺失属性对应的属性值为条件的第二子出现率信息;
所述根据所述第一出现率信息计算缺失属性对应的各属性值的第二出现率信息包括:
根据公式计算缺失属性对应的各属性值的第二出现率信息,其中,P(yi|R)为所述缺失属性对应的属性值yi的第二出现率信息,P(yi)为所述缺失属性对应的属性值yi的第一子出现率信息,P(Rj|yi)为属性值Rj以属性值yi为条件的第二子出现率信息,所述属性值Rj为所第一数据样本中非缺失属性的属性值。
3.根据权利要求1所述的方法,其特征在于,所述第一出现率信息包括所述缺失属性对应的各属性值在第二数据样本中的第一子出现率信息、所述第一数据样本中各非缺失属性的属性值在第二数据样本中以缺失属性对应的属性值为条件的第二子出现率信息以及所述第一数据样本非缺失属性的属性值对应的权重值信息;
所述根据所述第一出现率信息计算缺失属性对应的各属性值的第二出现率信息包括:
根据公式计算缺失属性对应的各属性值的第二出现率信息,其中,P(yi|R)为所述缺失属性对应的属性值yi在的第二出现率信息,P(yi)为所述缺失属性对应的属性值yi的第一子出现率信息,Wj为属性值Rj对应的权重值信息,P(Rj|yi)为属性值Rj以属性值yi为条件的第二子出现率信息,所述属性值Rj为所述第一数据样本中非缺失属性的属性值。
4.根据权利要求1所述的方法,其特征在于,在所述获取数据样本中缺失属性和非缺失属性的第一出现率信息之前,还包括:
对第二数据样本进行训练以确定数据样本中缺失属性和非缺失属性的第一出现率信息。
5.根据权利要求4所述的方法,其特征在于,所述对第二数据样本进行训练以确定数据样本中缺失属性和非缺失属性的第一出现率信息,包括:
按照设定比例将第二数据样本划分为训练样本集和测试样本集;
对所述训练样本集进行训练以确定数据样本中缺失属性和非缺失属性的当前出现率信息;
采用所述测试样本集对所述当前出现率信息进行测试以生成测试结果;
如果所述测试结果符合设定的准确率阈值,则结束训练操作;否则,则重新划分训练样本集和测试样本集,并对重新划分后的训练样本集进行训练直至所述测试结果符合设定的准确率阈值为止;
将结束训练时的当前出现率信息标记为数据样本中缺失属性和非缺失属性的第一出现率信息。
6.根据权利要求1-5任一所述的方法,其特征在于,所述非缺失属性为缺失属性的相关属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710142462.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网络信息所属地域识别方法及装置
- 下一篇:一种基于H5的页面显示方法和终端
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置