[发明专利]一种对房型进行分类的方法、装置、介质及电子设备在审
申请号: | 202211022469.6 | 申请日: | 2022-08-25 |
公开(公告)号: | CN115358230A | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 郜文彬 | 申请(专利权)人: | 北京分贝通科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘广 |
地址: | 100000 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 进行 分类 方法 装置 介质 电子设备 | ||
1.一种对房型进行分类的方法,其特征在于,所述方法包括:
获取至少一个供应商中的房型数据;
对所述房型数据进行分词得到分词结果,并根据所述分词结果构建特征向量得到特征向量集合;
将所述特征向量集合输入随机森林分类器中,得到初始分类结果;
根据所述初始分类结果构建无向图,采用深度优先遍历算法对所述无向图进行连通性分析得到至少一个连通子图,与所述至少一个连通子图中各连通子图对应的一个或多个房型确认为属于一类房型。
2.如权利要求1所述的方法,其特征在于,
所述获取至少一个供应商的房型数据,包括:
获取基础房型数据,并通过所述供应商提供的接口获取供应商房型列表,得到所述房型数据。
3.如权利要求1所述的方法,其特征在于,所述对所述房型数据进行分词得到分词结果,并根据所述分词结果构建特征向量,包括:
基于多种分词类别对所述房型数据进行分词处理,得到分词结果,其中,所述分词类别至少包括:酒店房型名称、楼层、床型,面积、服务、设施和发票;
根据所述分词结果和余弦相似度算法构建所述特征向量,得到特征向量集合。
4.如权利要求3所述的方法,其特征在于,
所述将所述特征向量集合输入随机森林分类器中,得到初始分类结果,包括:
将所述特征向量集合输入所述分类器,得到两两房型属于同一房型的得分。
5.如权利要求4所述的方法,其特征在于,在将所述特征向量集合输入随机森林分类器中之前,所述方法还包括:
从样本集合T中有放回的随机选择N个样本,通过所述随机选择N个样本训练一个决策树;
当每个样本有M个属性时,在所述决策树的每个节点需要分裂时,随机从所述M个属性中选取出m个属性,并从所述m个属性中选择1个属性作为该节点的分裂属性,其中,mM。
6.如权利要求5所述的方法,其特征在于,所述根据所述初始分类结构构建无向图,采用深度优先遍历算法对所述无向图进行连通性分析得到至少一个连通子图,包括:
根据所述初始分类结果得到所述无向图;
以连通关系对所述无向图图进行分组,得到的每一个子图属于一个房型。
7.如权利要求6所述的方法,其特征在于,在所述以连通关系对所述初始图进行分组之后,所述方法还包括:
对每个子图的各个节点以供应商类型的优先级选择出主房型和挂载房型。
8.如权利要求6所述的方法,其特征在于,所述以连通关系对所述初始图进行分组,包括:
从所述初始分类结果中提取房型节点数组;
按供应商优先级对所述节点数组进行排序;
遍历所述节点数组,提取一层邻接关系;
遍历所述节点数组结合所述邻接关系,用栈进行深度优先遍历进行房型分组。
9.一种对房型进行分类的装置,其特征在于,所述装置包括;
房型数据获取模块,被配置为获取至少一个供应商的房型数据;
分词及构造特征向量模块,被配置为对所述房型数据进行分词得到分词结果,并根据所述分词结果构建特征向量得到特征向量集合;
初始分类结果获取模板,被配置为将所述特征向量集合输入随机森林分类器中,得到初始分类结果;
房型分类模块,被配置为根据所述初始分类结果构建无向图,采用深度优先遍历算法对所述无向图进行连通性分析得到至少一个连通子图,与所述至少一个连通子图中各连通子图对应的一个或多个房型确认为属于一类房型。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时可实现权利要求1-8中任意一项权利要求所述的方法。
11.一种信息处理设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现权利要求1-8中任意一项权利要求所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京分贝通科技有限公司,未经北京分贝通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211022469.6/1.html,转载请声明来源钻瓜专利网。