[发明专利]一种用户话单大数据基站连接信息用户关系推定方法在审
申请号: | 201710982406.8 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107729940A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 曹万鹏;史辉;罗云彬;李鹏;李浩;徐青;林绍福 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 话单大 数据 基站 连接 信息 关系 推定 方法 | ||
技术领域
本发明属于人工智能技术领域,尤其涉及一种基于 Bayes的用户话单大数据基站连接信息用户关系推定方法。
背景技术
分类算法就是基于分类器模型为待检测样本从可选的分类中选取最佳的类别假设,它属于人工智能中机器学习范畴,已经吸引了该领域相关研究者的极大关注。人们投入了大量的时间和精力研究诸如C4.5、支持向量机、贝叶斯算法、AdaBoost算法和K-最近邻分类算法等分类算法,并将它们应用于面部识别、笔迹验证、数据分析和医学应用等不同领域。
而贝叶斯算法中,朴素贝叶斯分类器(Naive Bayes Classifiers)由于其高精度、高效率、理论基础坚实等优点而得到了广泛应用。朴素贝叶斯分类器是基于给定分类特征条件下属性值之间相互条件独立的假设而工作的。尽管现实中这种独立性假设常常难以满足,但近期对监督性学习的研究表明在很多领域,基于这一假设的朴素贝叶斯分类器在分类性能上可以与决策树算法、最近邻算法等一批优秀分类算法相媲美。
朴素贝叶斯分类器有以下特征,它并不确定的指定样本属于哪一类,而是通过概率的计算给出样本属于某一类别的可能。当样本属于某一类的概率最高时,判断这一分类假设为该样本的类别。假设A1,A2,…,An是一个n个特征的数据集,且有m个分类类别,C={C1,C2,C3,…,Cm}。给定一个具体的样本x,其对应特征属性为a1,a2,...,an,这里ai是特征属性Ai的具体取值,该样本属于某一类别Ci的后验概率是P(x|Ci),c(x)表示分类所得的样本分类标签。贝叶斯分类器模型可表示为:
c(x)=arg max P(Ci)P(X|Ci)(I)
但是上述公式的后验概率常难以计算,因此朴素贝叶斯分类器引入了以下假设:在给定类别C的条件下,所有的属性Ai相互独立。即:
在朴素贝叶斯分类算法中,既可以独立的学习每个特征属性Ai在类别C下的条件概率P(Ai|C),也可以独立学习每个属性Ai的概率。因为P(C)值为常数,可用归一化因子a来代替。然后,分类器应用贝叶斯公式计算特定样本数据在给定属性值下类别的后验概率为:
决定朴素贝叶斯分类算法性能的一个重要因素是样本特征的选择,好的样本特征选择可以提高分类器的分类性能,而一个不恰当的特征选取必然导致误判率的增高。本发明基于用户之间通信相关特征、基站连接相关特征与用户亲疏度之间的关系,提出基于用户话单大数据中基站连接信息的用户关系推定方法与系统。
发明内容
基于用户之间通话相关特征、基站连接相关特征与用户亲疏度之间的关系,提供一种基于 Bayes的用户话单大数据基站连接信息用户关系推定方法,通过对一般用户生活特征的分析,基于统计方法进行这几个特征的计算:1、计算用户间互通话信息(频次、时长、粘度等);2、计算用户间相同基站连接信息(频次、粘度、时间点等)。根据上述信息,基于 Bayes分类算法,采用用户话单大数据相关统计量,对用户的可能亲疏程度进行准确判断,使得最终基于 Bayes算法的分类器分类效果更佳、分类精度更高。
一种用户话单大数据基站连接信息用户关系推定方法,包括如下步骤:
(1)基于话单大数据信息,发掘能从根本上反映不同用户之间关系亲疏程度的相关特征数据;
在话单大数据中定位某用户及其连接的全部基站信息,寻找这些基站下与该用户同时出现的其他用户,包括用户间通话的相关信息(全部),共同出现在相同基站下的频次信息,出现在相同基站下的频次信息,一定时间内共同出现在相同基站下的粘度信息,出现在相同基站下的时间点信息(早、中、晚;工作日、休息日;节假日等),上述信息的离散度信息等相关数据;
(2)对所要分析用户间上述话单数据中基站数据进行分析,对上述相关特征信息进行提取、分析和处
本发明涉及到对话单中可以推断用户之间亲疏程度信息的挖掘、计算、分析,它们决定了是否可以准确、高效的对用户的亲疏度进行推断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710982406.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置