[发明专利]基于预测建模技术的搜索系统及方法在审
申请号: | 201711107547.1 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107798124A | 公开(公告)日: | 2018-03-13 |
发明(设计)人: | 王凤;杨宁 | 申请(专利权)人: | 深圳市华讯方舟软件信息有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律和信知识产权代理事务所(普通合伙)11446 | 代理人: | 武玉琴,刘国伟 |
地址: | 518104 广东省深圳市宝*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 预测 建模 技术 搜索 系统 方法 | ||
1.一种基于预测建模技术的搜索系统,所述系统包括数据库、数据清洗单元、数据整理单元、建模分析单元、建模测试单元、结果集,其中:
所述数据库与所述数据清洗单元网络连接;
所述数据清洗单元与所述数据整理单元网络连接;
所述数据整理单元与所述建模分析单元网络连接;
所述建模分析单元与所述建模测试单元网络连接;
所述建模测试单元通过模型输出单元与所述结果集网络连接;
所述结果集与所述数据清洗单元网络连接。
2.根据权利要求1所述的系统,其特征在于,所述数据清洗单元还包括描述分析单元,所述描述分析单元与所述数据整理单元网络连接。
3.根据权利要求1所述的系统,其特征在于,所述结果集包括建模日志单元、建模分析过程单元、数据汇总单元、人为因素单元,各单元都是结果集的数据组成部分。
4.一种基于预测建模技术的搜索方法,包括以下步骤:
步骤S1,利用数据采集设备采集第一数据进行程序解析后存放在数据库,所述数据库把所述第一数据送到数据清洗单元;
步骤S2,所述数据清洗单元接收所述第一数据进行数据清洗,丢弃不合格数据,把合格的第二数据通过网络传送到数据整理单元;
步骤S3,所述数据整理单元接收所述第二数据进行数据整理分析,将得到的数据特征通过网络传送到建模分析单元;
步骤S4,所述建模分析单元根据所述数据特征建立数据模型,根据所述数据模型计算出模型的参数值,将该参数值通过网络传到建模测试单元;
步骤S5,所述建模测试单元根据建立模型的参数值进行数据搜索,利用专门的测试模型对搜索的数据进行测试,根据测试的准确度修改建模分析的方法,把测试结果错误的数据返回到所述建模分析单元修正数据模型,把测试结果正确的数据通过模型输出单元送到所述结果集;
步骤S6,所述结果集存储并应用所述第三数据进行事件预测。
5.根据权利要求4所述的方法,其特征在于,步骤S2中,所述数据清洗单元清洗数据时,对有特殊需求的数据,可以利用所述数据清洗单元的描述分析单元,加入人为干扰的数据分析规则,分析后把合格的第二数据通过网络传送到所述数据整理单元。
6.根据权利要求4所述的方法,其特征在于,步骤S2中,所述数据清洗单元清洗数据的方式包括检查数据一致性、处理无效值和缺失值;去除残缺数据、错误数据、重复数据;数据标准化;数据分类。
7.根据权利要求4所述的方法,其特征在于,步骤S3中,所述数据整理单元进行数据整理分析的方式包括数据整理、数据关联。
8.根据权利要求4所述的方法,其特征在于,步骤S4中,所述建模分析单元建模的方法主要利用了数据分析法,从大量的观测数据中,利用统计方法建立数学模型。
9.根据权利要求4所述的方法,其特征在于,步骤S5中,所述结果集存储并应用所述第三数据的方式包括以下步骤:
利用所述建模日志单元记录整个系统工作过程的日志;
利用所述建模过程分析单元记录建模分析过程,用于各个业务部分的具体业务分析;
利用所述人为因素单元记录分析过程中加入的人为的业务需求;
利用所述数据汇总单元汇总最后的所述第三数据。
10.根据权利要求4所述的方法,其特征在于,所述结果集,将得到的所述第三数据通过网络传送到所述数据清洗单元,进行数据的再次清洗,以修正模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华讯方舟软件信息有限公司,未经深圳市华讯方舟软件信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711107547.1/1.html,转载请声明来源钻瓜专利网。