[发明专利]生成标题的方法和装置在审
申请号: | 201810844000.8 | 申请日: | 2018-07-27 |
公开(公告)号: | CN110852078A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 李俊涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;张效荣 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 标题 方法 装置 | ||
1.一种生成标题的方法,其特征在于,包括:
从历史搜索数据中提取搜索关键字;
对所述搜索关键字进行聚类,得到关键字数据集;
分析所述关键字数据集,得到核心关键字和所述核心关键字的核心权值;
基于所述核心关键字的核心权值生成标题。
2.根据权利要求1所述的方法,其特征在于,分析所述关键字数据集,得到核心关键字和所述核心关键字的核心权值包括:
计算所述关键字数据集的平均值作为核心关键字;
为所述核心关键字分配初始权值;
利用双向神经网络计算所述关键字数据集之间的相似度值;
基于相似度值对所述初始权值进行调整,得到调整权值,选择最大的所述调整权值作为核心权值。
3.根据权利要求2所述的方法,其特征在于,基于相似度值对所述初始权值进行调整,得到调整权值包括:
利用权值处理公式对所述初始权值进行调整,得到调整权值,选择最大的所述调整权值作为核心权值;
其中,所述权值处理公式为:
W=v+α(x-v);W是调整权值,v是初始权值,x是调整的自变量,α是相似度值。
4.根据权利要求1所述的方法,其特征在于,对所述搜索关键字进行聚类包括:
利用K-均值算法、K-中心点算法、基于密度的聚类算法或高斯混合模型对所述搜索关键字进行聚类。
5.根据权利要求1所述的方法,其特征在于,对所述搜索关键字进行聚类,得到关键字数据集包括:
随机选取K个所述搜索关键字作为聚类质心点;
将与聚类质心点类别相同的所述搜索关键字划分为一个关键字聚类;
计算关键字聚类的平均值作为新聚类质心点;
将与新聚类质心点类别相同的所述搜索关键字重新划分为一个关键字聚类;
将聚类质心点不再变化或划分次数达到预设值的关键字聚类作为关键字数据集。
6.根据权利要求1所述的方法,其特征在于,从历史搜索数据中提取搜索关键字包括:
对历史搜索数据进行聚类,得到历史数据集;
计算所述历史数据集的平均值作为搜索关键字。
7.根据权利要求1-6中任一所述的方法,其特征在于,所述方法还包括:
基于实时搜索数据提取实时关键字;
对所述实时关键字进行聚类,得到实时数据集;
分析所述实时数据集,得到校验关键字和所述校验关键字的校验权值;
基于所述校验关键字的校验权值校验或调整标题。
8.一种生成标题的装置,其特征在于,包括:
提取模块,用于从历史搜索数据中提取搜索关键字;
聚类模块,用于对所述搜索关键字进行聚类,得到关键字数据集;
分析模块,用于分析所述关键字数据集,得到核心关键字和所述核心关键字的核心权值;
生成模块,用于基于所述核心关键字的核心权值生成标题。
9.根据权利要求8所述的装置,其特征在于,所述分析模块还用于:
计算所述关键字数据集的平均值作为核心关键字;
为所述核心关键字分配初始权值;
利用双向神经网络计算所述关键字数据集之间的相似度值;
基于相似度值对所述初始权值进行调整,得到调整权值,选择最大的所述调整权值作为核心权值。
10.根据权利要求9所述的装置,其特征在于,所述分析模块进一步用于:
利用权值处理公式对所述初始权值进行调整,得到调整权值,选择最大的所述调整权值作为核心权值;
其中,所述权值处理公式为:
W=v+α(x-v);W是调整权值,v是初始权值,x是调整的自变量,α是相似度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810844000.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种洗衣机及控制方法
- 下一篇:一种视频搜索方法、视频播放终端及存储介质