[发明专利]画单生成方法及装置,电子设备,计算机可读存储介质在审
申请号: | 201811105767.5 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109242030A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 周希波;李慧 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/906;G06F16/9535 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户行为数据 聚类算法 计算机可读存储介质 电子设备 聚类结果 聚类 组对 预先设置 准确率 喜好 | ||
本发明涉及一种画单生成方法及装置,电子设备,计算机可读存储介质。一种画单生成方法包括:获取画作数据和用户行为数据;利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;根据所述聚类结果生成画单。可见,本实施例中,由于增加了用户行为数据,可以基于用户的喜好来确定画单,有利于提高推荐效率。本实施例中利用(包括多个聚类算法的)聚类算法组对画作数据进行聚类,提高生成画单的效率和准确率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种画单生成方法及装置,电子设备,计算机可读存储介质。
背景技术
画作资源日趋丰富,现有的推荐系统中针对画作间的关联度可以得到画单,并然后向用户推荐画单,从而可以提升推荐效率。另外,对于线上的画作欣赏与交易平台以及线下的画作展览,生成画单可有效地确立主题和展区,可以对平台的结构和展览的流程起到指导性作用。
现在的画单生成方法,需要人工检阅与标注主题(或关键词),然后可以对标注内容进行处理,从而得到画单。然而,由于画作信息包括图像、文本、矩阵等多种数据,导致生成画单的难度较大。
发明内容
本发明提供一种画单生成方法及装置,电子设备,计算机可读存储介质,以解决相关技术中由于画作信息复杂而导致画单生成难度较大的问题。
根据本发明实施例的第一方面,提供一种画单生成方法,包括:
获取画作数据和用户行为数据;
利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果;
根据所述聚类结果生成画单。
可选地,所述聚类算法组至少包括多个采用不同原理的聚类算法和对所述采用不同原理的聚类算法的聚类结果进行融合的融合聚类算法,利用预先设置的聚类算法组对所述画作数据和所述用户行为数据进行聚类,得到聚类结果包括:
对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量;
针对所述多个采用不同原理的聚类算法中的每一个算法,将所述降维后的特征向量输入到所述聚类算法,得到用于表征画作间关联关系的中间聚类结果;
将所述每个聚类算法的中间聚类结果输入到所述融合聚类算法,得到最终的聚类结果。
可选地,所述多个采用不同原理的聚类算法至少包括以下两种:
基于划分的聚类、基于层次的聚类、基于密度的聚类和基于模型的聚类。
可选地,对所述画作数据和所述用户行为数据进行处理,得到降维后的特征向量包括:
根据所述画作数据和所述用户行为数据提取出基于物品的特征向量;
融合所述基于物品的特征向量,得到融合特征向量;
利用主成份分析法将所述融合特征向量转换为降维后的特征向量。
可选地,根据所述画作数据和所述用户行为数据提取出基于物品的特征向量包括:
针对所述画作数据中的画作图像信息,利用栈式自编码器逐层提取特征,并将所提取的特征进行降维处理,得到所述画作数据对应的高阶特征向量;
针对所述画作数据中的画作特征信息,利用独热编码对类别特征进行编码,并对所述数值特征进行归一化处理,得到第一画作特征向量;
针对所述用户行为数据中的结构化的行为数据,利用交替最小二乘法分解所述结构化的行为数据,得到第二画作特征向量;
针对所述用户行为数据中的非结构化的行为数据,利用文档主题生成模型提取所述非结构化的行为数据中隐含主题概率向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811105767.5/2.html,转载请声明来源钻瓜专利网。