[发明专利]一种游戏智能评级方法与系统有效
申请号: | 201810213868.8 | 申请日: | 2018-03-15 |
公开(公告)号: | CN108389082B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 陈宇恒;马朔;刘冶;李浩跃;李锦芬;彭楠;徐振涛;印鉴 | 申请(专利权)人: | 火烈鸟网络(广州)股份有限公司;中山大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/35;G06F40/289;G06K9/62 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510620 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 游戏 智能 评级 方法 系统 | ||
1.一种游戏智能评级方法,其特征在于,包括以下步骤:
采集已上线游戏在上线前的数值数据和文本数据,其中,所述数值数据为该已上线游戏自身参数,所述文本数据包括短文本数据和长文本数据;
提取已上线游戏在上线前的数值特征和文本特征并进行特征处理,其中,所述文本特征包括短文本特征和长文本特征;
根据特征处理后已上线游戏在上线前的数值特征、文本特征和已上线游戏的游戏级别标签,建立并训练最优随机森林算法模型,其中,所述游戏级别标签为:根据已上线游戏上线后一段时间内的受欢迎程度和盈利能力设立的游戏级别;
采集未上线游戏的数值数据和文本数据;
提取未上线游戏的数值特征和文本特征并进行特征处理;
根据所述的最优随机森林算法模型,输入特征处理后未上线游戏的数值特征和文本特征,预测未上线游戏的游戏级别;
其中,所述提取已上线游戏在上线前的数值特征和文本特征的步骤中,包括提取已上线游戏在上线前的短文本特征,具体包括以下步骤,
对每种短文本数据,将每个已上线游戏在上线前的短文本数据转换成用TF-IDF权重向量空间来表示的形式,并记录该短文本数据对应的文本语料库;
通过LDA聚类对每个转换成TF-IDF权重向量空间形式的已上线游戏进行分类,将所有已上线游戏划分为N类具有相同隐含主题的游戏,将每个已上线游戏所属的隐含主题作为该已上线游戏的短文本特征,并记录该短文本数据对应的N个聚簇中心,其中,N为一常数;
所述提取未上线游戏的数值特征和文本特征的步骤中,包括提取未上线游戏的短文本特征,具体包括以下步骤,
对每种短文本数据,根据所述记录的对应短文本数据的文本语料库,将每个未上线游戏的短文本数据转换成用TF-IDF权重向量空间来表示的形式;
根据所述记录的对应短文本数据的N个聚簇中心,对每个转换成TF-IDF权重向量空间形式的未上线游戏进行分类,将所有未上线游戏划分为N类具有相同隐含主题的游戏,将每个未上线游戏所属的隐含主题作为该游戏的短文本特征。
2.根据权利要求1所述的游戏智能评级方法,其特征在于,所述特征处理的具体方式包括,对枚举的数值特征或者文本特征进行独热编码,对连续的数值特征或者文本特征进行离散化表示。
3.根据权利要求1所述的游戏智能评级方法,其特征在于,所述提取已上线游戏在上线前的数值特征和文本特征的步骤中,包括提取已上线游戏在上线前的长文本特征,所述长文本特征包括不带情感因素的长文本特征和带有情感因素的长文本特征,对于不带情感因素的长文本特征,所述提取已上线游戏在上线前的长文本特征具体包括以下步骤:
对每种不带情感因素的长文本数据,利用分词工具将每个已上线游戏在上线前的不带情感因素的长文本数据切为多个短文本数据;
对得到的多个短文本数据进行相邻两两组合,并转换成TF-IDF权重向量空间的形式,同时记录该不带情感因素的长文本数据对应的文本语料库;
通过LDA聚类对每个转换成TF-IDF权重向量空间形式的已上线游戏进行分类,将所有已上线游戏划分为N类具有相同隐含主题的游戏,将每个已上线游戏所属隐含主题作为该已上线游戏不带情感因素的长文本特征,并记录该已上线游戏不带情感因素的长文本数据对应的N个聚簇中心,其中,N为一常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于火烈鸟网络(广州)股份有限公司;中山大学,未经火烈鸟网络(广州)股份有限公司;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810213868.8/1.html,转载请声明来源钻瓜专利网。