[发明专利]一种虚假交易信息识别方法有效
申请号: | 201310037691.8 | 申请日: | 2013-01-31 |
公开(公告)号: | CN103064987A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 王永康;张爱华 | 申请(专利权)人: | 五八同城信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 田俊峰 |
地址: | 300457 天津市滨海新区第一*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 虚假 交易 信息 识别 方法 | ||
1.一种虚假交易信息识别方法,其特征在于,包括:
步骤S101,获取用户发布信息的信息特征、信息内容和/或图片信息;
步骤S201,根据用户发布信息的信息特征、信息内容和/或图片信息,对用户发布消息进行虚假交易信息识别。
2.如权利要求1所述的虚假交易信息识别方法,其特征在于,在获取用户发布信息的信息特征之前,包括以下步骤:
步骤S1011,获取之前用户发布消息的基本数据;
步骤S1012,根据获取的之前用户发布消息的基本数据,提取训练数据,确定正负样本;
步骤S1013,对正负样本中的数据进行特征转换,得到设定数据格式的数据;
步骤S1014,根据设定数据格式的数据,建立回归模型。
3.如权利要求2所述的虚假交易信息识别方法,其特征在于,步骤S1013具体包括:
将正负样本中的每条数据的特征确定为数值型或枚举型两类;
数值型的维度值不变,在数值型数据处于样本中的位置处置该数值型数据的数值;
枚举型的维度值则先计算其md5值,然后将md5值对W取模,得到取模结果;在样本中将处于取模结果位置的数值置1。
4.如权利要求3所述的虚假交易信息识别方法,其特征在于,步骤S1014具体包括:
将步骤S1013得到的数据转化为稀疏矩阵;
在模型训练程序程序中输入产生的稀疏矩阵(x1,x2,x3,x4,x5,……,xp),p为设定数据格式的数据的数据量;得到每一条记录对应的参数(β0,β1,β2,β3,β4,β5,……,βp);
建立回归模型,回归模型为:其中g(x)=β0+β1x1+β2x2+…+βpxp。
5.如权利要求4所述的虚假交易信息识别方法,其特征在于,在建立回归模型之后,当接收到用户发布信息时,则步骤S101具体为:
步骤S1015,获取用户发布消息的基本数据;包括提取用户发布消息的基本特征和获取元特征;基本特征与元特征一起作为挖掘的基本数据。
6.如权利要求5所述的虚假交易信息识别方法,其特征在于,在获取用户发布消息的基本数据之后,步骤S201具体包括以下步骤:
步骤S2011,对获取用户发布消息的基本数据进行特征转换,得到设定数据格式的数据;
步骤S2012,将步骤S2011得到的设定数据格式的数据转化为稀疏矩阵的形式,通过回归模型进行虚假消息识别;其中,P>M,则Y=1,表示用户发布信息为真实交易信息;反之,P≤M,则Y=0,表示用户发布信息为虚假交易信息;M是预先设定的阈值。
7.如权利要求1或6所述的虚假交易信息识别方法,其特征在于,在获取用户发布信息的信息内容之前,包括以下步骤:
步骤S1021,获取之前用户发布消息的信息内容并进行审核,将通过审核与没通过审核的信息分为两类,作为分类的样本数据;
步骤S1022,对样本中的信息内容进行分词;
步骤S1023,通过计算,抽取特征词;
步骤S1024,计算每类中每篇文档内的每个特征词的特征值;
步骤S1025,根据获取每类中每篇文档内的每个词的特征值,通过训练得到识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八同城信息技术有限公司,未经五八同城信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310037691.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钻井液分析装置
- 下一篇:基于单束光分束的激光诱导击穿光谱分析装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置