[发明专利]应用于装修行业的征信信息采集系统在审
申请号: | 201911032495.5 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110941753A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 祝德兆 | 申请(专利权)人: | 北京华跃博弈科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06K9/62;G06Q40/02;G06Q50/08 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 装修 行业 信息 采集 系统 | ||
1.一种应用于装修行业的征信信息采集系统,其特征在于,所述征信信息采集系统包括:用于进行数据采集的数据抓取模块,以及用于进行无效数据剔除的数据剔除模块;其中:
所述数据抓取模块按照信息采集指令,执行信息采集任务,抓取所述信息采集指令映射的征信信息数据,并将抓取的征信信息数据发送至所述数据剔除模块,由所述数据剔除模块判断所采集的征信信息数据是否可用;
所述数据剔除模块对所述数据抓取模块发送的所有征信信息数据进行分类,并按照预设剔除规则,将采集的征信信息数据中的无效数据进行筛选和剔除。
2.如权利要求1所述的应用于装修行业的征信信息采集系统,其特征在于,所述数据剔除模块对所述数据抓取模块发送的所有征信信息数据进行分类,包括:
所述数据剔除模块对输入的所有征信信息数据进行预处理操作,所述预处理操作包括中文分词和停用词处理;
采用基于权重的改进贝叶斯分类算法模型,对预处理后的征信信息数据进行分类;其中,所述分类算法模型对应的数学表达式(1)为:
所述数学表达式(1)中,j为类别个数变量,初始值为1,以1为单位递增,最大为类别的个数总量m;ej为第j个类,c为类别,i为征信信息个数变量,初始值为1,以1为单位递增,最大为征信信息个数的总数量n;k为第j类内属性个数的变量,初始值为1,以1为单位递增,最大为类内属性个数的总量g;v为选择概率最大类别的最大概率,xi为第i个预处理过的征信信息的特征向量,wjk为第j类第k个属性的权重,wj为第j类的权重,max表示取最大值;
所述数据剔除模块将获得的最大概率v与预设置信阈值χ进行比较;若v>χ,则结束对所述征信信息数据的分类;若v≤χ,则继续使用所述分类算法模型执行分类操作。
3.如权利要求1所述的应用于装修行业的征信信息采集系统,其特征在于,所述数据剔除模块按照预设剔除规则,将采集的征信信息数据中的无效数据进行筛选和剔除时,判断所述征信信息数据为无效数据的判断公式(2)为:
所述判断公式(2)中,与xi有整体部分关系的征信信息集合为setu={μ1,μ2,...μr},与xi有同义关系的征信信息集合为setz={z1,z2,...zy},μq为第q个与xi有整体部分关系的征信信息,zv为第v个与xi有同义关系的征信信息,α、β为预设常数,ai为第i条征信信息数据为无效数据的判断值;
当ai大于预设阈值则认为xi征信信息数据不是无效数据;
当ai小于或者等于预设阈值则认为xi征信信息数据是无效数据。
4.如权利要求1至3任一项所述的应用于装修行业的征信信息采集系统,其特征在于,所述数据抓取模块接收所述信息采集指令,对所述信息采集指令的合法性进行验证;
若所述信息采集指令为合法指令,则所述数据抓取模块执行所述信息采集指令映射的信息采集操作事件;
若所述信息采集指令为非法指令,则所述数据抓取模块返回采集指令不合法的提示信息,供用户确认。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华跃博弈科技有限公司,未经北京华跃博弈科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911032495.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:不停机化霜的空调器及其控制方法
- 下一篇:一种生物炭制备用烘干装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置