[发明专利]一种手机游戏分类方法有效
申请号: | 201810018771.1 | 申请日: | 2018-01-09 |
公开(公告)号: | CN108228845B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 董守玲;张荣;陈海棋;董守斌 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种手机游戏分类方法,通过计算不同平台下的游戏的名称、图标和描述简介的相似度,找出同款游戏,统一互联网上16个游戏提供平台的分类体系,按照统一的标准,通过计算游戏的描述简介文本的句子向量相似度和主题分布向量,以分词统计后的游戏标题、原有平台名称和原有平台的分类标签作为输入,训练GBDT模型,然后进行特征融合,在采用特定的分类算法进行分类,准确地将不同平台下的各种游戏进行分类。本发明具有极高的准确率,效果好,能有效地提高不同数据源游戏分类的精确率。 | ||
搜索关键词: | 一种 手机 游戏 分类 方法 | ||
【主权项】:
1.一种手机游戏分类算法,其特征在于,包括以下步骤:1)从网络上爬取游戏信息,包括数据源名称、游戏图标和游戏描述简介,并保存至数据库;2)计算不同数据源的游戏的名称之间的最大公共子串相似度和游戏图标之间的颜色分布直方图相似度,计算游戏描述简介的句向量相似度,同时利用LDA主题生成模型,即潜在狄利克雷分布主题生成模型,计算得到游戏描述简介的LDA主题分布相似度,将计算得到的值与设定的阈值相比较,得到不同数据源的同款游戏集合;3)进行数据标注,使用同款游戏集合的结果,格式为:“游戏名称#所属平台#游戏ID”,然后根据统一的分类标准,将不同数据源的同款游戏分类到所属标签;4)计算各个数据源的游戏描述简介文本的句向量和LDA主题分布概率;5)以游戏名称、游戏所属平台和平台原有的分类标签作为输入特征,进行梯度提升决策树训练,即GBDT模型训练,得到GBDT叶子节点特征向量;6)将计算得到的游戏描述简介的句向量、主题向量、GBDT叶子结点向量进行特征融合;7)将融合后的特征向量作为输入特征,采用机器学习或深度学习算法进行训练,基于统一的分类标准,将不同数据源的游戏分为所属的分类标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810018771.1/,转载请声明来源钻瓜专利网。