[发明专利]一种基于历史关键词投放数据的关键词构建方法及系统在审
申请号: | 202011079017.2 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112183069A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 陈嘉真;徐凯波;张琛 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F16/33;G06F16/35 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 历史 关键词 投放 数据 构建 方法 系统 | ||
本发明公开了一种基于历史关键词投放数据的关键词构建方法及系统,关键词构建方法包括获取给定数据;根据给定数据按照一预设规则组建多个备选关键词;通过word2vec模型对多个备选关键词进行特征处理获取每一备选关键词的特征;根据每一备选关键词的特征与给定数据对多个备选关键词进行评估并排序;根据完成排序的多个备选关键词输出推荐关键词。本发明通过关键词的历史数据学习关键词的结构所预期的展现量和点击量,通过模型来指导关键词的构成,确保新构造的关键词合理,并且具有良好的投放表现。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于历史关键词投放数据的关键词构建方法及系统。
背景技术
随着网络技术和信息产品的快速发展,各种网络平台吸引了越来越多的用户,互联网已经成为当前最主要的信息传播媒体之一,目前,在购物平台的活动中,电商们会通过购买关键词来实现千人千面的客户引流,关键词构建就是从已知的语料中去提取一些词或字,组成新的词汇,从而形成精准的总结文本信息。
目前常用的关键词构建方法主要是按照人工设定的pattern随机组建一些关键词:首先将热度较高的词汇分成长尾词和核心词(目前大部分为人工筛选,也可通过对小样本打标然后用二分类模型进行分类)。然后按照“品牌词|品类词+核心词”,“品牌词|品类词+长尾词+核心词”等方式进行构建。
通过以上的方法可以勉强保证合理性,但由于pattern是人工制造,只能覆盖少数量的合理词汇。其次,词语的表现好坏也无法判断。
发明内容
本发明针对上述的关键词构建缺乏良好投放表现的技术问题,提出一种基于历史关键词投放数据的关键词构建方法及系统。
第一方面,本申请实施例提供了一种基于历史关键词投放数据的关键词构建方法,包括:
S1、获取给定数据;
S2、根据所述给定数据按照一预设规则组建多个备选关键词;
S3、通过word2vec模型对多个所述备选关键词进行特征处理获取每一所述备选关键词的特征;
S4、根据每一所述备选关键词的特征与所述给定数据对多个所述备选关键词进行评估并排序;
S5、根据完成排序的多个所述备选关键词输出推荐关键词。
上述基于历史关键词投放数据的关键词构建方法,其中,所述给定数据包括场景环境变量、候选热度词根、评估指标及推荐关键词数量。
上述基于历史关键词投放数据的关键词构建方法,其中,所述步骤S2包括:
步骤S21:根据所述候选热度词根随机组建多个关键词;
步骤S22:按照预设规则从所述多个关键词中筛选出多个所述备选关键词。
上述基于历史关键词投放数据的关键词构建方法,其中,所述步骤S3中还包括:预先使用jieba对所述备选关键词进行分词处理。
上述基于历史关键词投放数据的关键词构建方法,其中,所述步骤S3中还包括:通过采用word2vec模型对分词处理后所述备选关键词进行预训练得到词向量,取所述备选关键词的词向量平均和作为所述备选关键词的特征。
上述基于历史关键词投放数据的关键词构建方法,其中,所述步骤S4包括:
步骤S41:根据所述备选关键词的特征与所述场景环境变量及所述评估指标通过预测模型得出指标表现;
步骤S42:根据所述指标表现通过所述评估模型对多个所述备选关键词进行排序。
上述基于历史关键词投放数据的关键词构建方法,其中,所述步骤S5中还包括根据所述推荐关键词数量输出推荐关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011079017.2/2.html,转载请声明来源钻瓜专利网。