[发明专利]生成标题的方法和装置在审

专利信息
申请号: 201810844000.8 申请日: 2018-07-27
公开(公告)号: CN110852078A 公开(公告)日: 2020-02-28
发明(设计)人: 李俊涛 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F40/258 分类号: G06F40/258
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 张一军;张效荣
地址: 100195 北京市海淀区杏石口路6*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 生成 标题 方法 装置
【说明书】:

发明公开了一种生成标题的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从历史搜索数据中提取搜索关键字;对搜索关键字进行聚类,得到关键字数据集;分析关键字数据集,得到核心关键字和核心关键字的核心权值;基于核心关键字的核心权值生成标题。该实施方式能够提高命中转化率和用户体验;所生成的标题精准地包含了用户关注的产品特征,且与产品的内容相符合。

技术领域

本发明涉及计算机技术领域,尤其涉及一种生成标题的方法和装置。

背景技术

随着网络的普及和计算机技术的发展,网络早已融入人们的生活,并为生活带来便利。目前,人们已习惯网络生活,通过网络购买商品、查看新闻以及搜索论文等等。

通常,用户会采用关键字的方式搜索、浏览相关产品。而各个网站平台在展示其产品(例如商品、新闻或论文等)时,为减小所占用页面或便于用户浏览等,仅展示产品的标题,该标题是根据产品的内容或特征所生成的一个简短介绍。目前,生成标题的方法主要有两种:

1.抽取式,从产品的原文中抽取生成标题的摘要句子和词,对摘要句子和词进行文本压缩,从而生成标题;

2.生成式,生成标题的摘要句子和词,对摘要句子和词进行文本压缩,从而生成标题,其中,摘要句子和词可以自由生成,而并不要求一定从原文中抽取。

目前,大多娄网站平台为了提高产品的搜索命中率,提高商品购买量、新闻阅读量或论文阅读量等,会使产品的标题最大限度地覆盖多个类别的关键字,增加标题的文本长度。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

现有技术所生成的标题存在不够精准、文本过长或冗余等问题,通过关键字搜索易出现搜索到的产品数量过多、或搜索到的部分产品与关键字不符等现象,命中转化率低,且用户体验差。

发明内容

有鉴于此,本发明实施例提供一种生成标题的方法和装置,能够提高命中转化率和用户体验;所生成的标题精准地包含了用户关注的产品特征,且与产品的内容相符合。

为实现上述目的,根据本发明实施例的一个方面,提供了一种生成标题的方法。

本发明实施例的一种生成标题的方法包括:从历史搜索数据中提取搜索关键字;对所述搜索关键字进行聚类,得到关键字数据集;分析所述关键字数据集,得到核心关键字和所述核心关键字的核心权值;基于所述核心关键字的核心权值生成标题。

可选地,分析所述关键字数据集,得到核心关键字和所述核心关键字的核心权值包括:计算所述关键字数据集的平均值作为核心关键字;为所述核心关键字分配初始权值;利用双向神经网络计算所述关键字数据集之间的相似度值;基于相似度值对所述初始权值进行调整,得到调整权值,选择最大的所述调整权值作为核心权值。

可选地,基于相似度值对所述初始权值进行调整,得到调整权值包括:利用权值处理公式对所述初始权值进行调整,得到调整权值,选择最大的所述调整权值作为核心权值;其中,所述权值处理公式为:W=v+α(x-v);W是调整权值,v是初始权值,x是调整的自变量,α是相似度值。

可选地,对所述搜索关键字进行聚类包括:利用K-均值算法、K-中心点算法、基于密度的聚类算法或高斯混合模型对所述搜索关键字进行聚类。

可选地,对所述搜索关键字进行聚类,得到关键字数据集包括:随机选取K个所述搜索关键字作为聚类质心点;将与聚类质心点类别相同的所述搜索关键字划分为一个关键字聚类;计算关键字聚类的平均值作为新聚类质心点;将与新聚类质心点类别相同的所述搜索关键字重新划分为一个关键字聚类;将聚类质心点不再变化或划分次数达到预设值的关键字聚类作为关键字数据集。

可选地,从历史搜索数据中提取搜索关键字包括:对历史搜索数据进行聚类,得到历史数据集;计算所述历史数据集的平均值作为搜索关键字。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810844000.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top