[发明专利]自动生成广告标题的方法、装置及计算机可读存储介质在审
申请号: | 201811018044.1 | 申请日: | 2018-09-03 |
公开(公告)号: | CN110928983A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 王金成;郭文涛;游齐恒 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06Q30/02 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 姜雍;方亮 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 生成 广告 标题 方法 装置 计算机 可读 存储 介质 | ||
1.一种自动生成广告标题的方法,包括:
获取目标商品的细分类目词语;
将目标商品的细分类目词语输入预先训练的神经网络进行处理,得到目标商品的广告标题。
2.如权利要求1所述的方法,所述方法还包括:
获取样本商品的细分类目词语以及样本商品的广告标题;
利用样本商品的细分类目词语以及样本商品的广告标题,对神经网络进行训练,使得训练后的神经网络能够对输入的目标商品的细分类目词语进行处理,得到目标商品的广告标题。
3.如权利要求2所述的方法,所述方法还包括:
对样本商品的描述语句和评论语句进行切词,得到样本商品的各个切词语料;
利用词到向量模型,确定样本商品的切词语料对应的词向量;
将所述词向量作为所述切词语料在神经网络中的初始化词向量。
4.如权利要求2所述的方法,所述方法还包括:
采用序列到序列模型作为所述神经网络;
训练时在序列到序列模型的输出层定义如下损失函数,以便序列到序列模型调整权重使得损失函数值Hy'(y)最小;
Hy'(y)=-∑i{∑xyi'(x)log[yi(x)]}
其中,i表示序列到序列模型根据样本商品的细分类目词语得到的广告标题中各个词语的序号,x表示各个切词语料的序号,yi(x)表示序列到序列模型根据样本商品的细分类目词语得到的广告标题中第i个词语为切词语料x的概率,yi’(x)表示样本商品的广告标题中第i个词语为切词语料x的概率。
5.如权利要求1至4中任一项所述的方法,所述方法还包括:
利用目标商品的描述语句和评论语句训练Ngram语言模型;
利用Ngram语言模型对目标商品的广告标题进行通顺度评分;
按照通顺度评分由大到小的顺序,对目标商品的广告标题进行排序,并获取序号小于预设值的目标商品的广告标题。
6.如权利要求5所述的方法,其中,所述利用Ngram语言模型对目标商品的广告标题进行通顺度评分包括:
利用如下公式计算目标商品的广告标题的通顺度score:
其中,j表示目标商品的广告标题中各个词语的序号,wj表示目标商品的广告标题中第j个词语,P(wj|w1..wj-1)表示连续词语w1..wj-1之后出现词语wj的概率,n表示连续词语的数量,weightn表示连续n个词语出现的概率所对应的Ngram语言模型权重。
7.如权利要求1所述的方法,所述方法还包括采用以下至少一种方式进行词语删减:
在目标商品的广告标题的开始词不属于开始词集时,删除目标商品的广告标题的开始词,所述开始词集由目标商品的描述语句和评论语句中的开始词组成;
以及,
在目标商品的广告标题的结束词不属于结束词集时,删除目标商品的广告标题的结束词,所述结束词集由目标商品的描述语句和评论语句中的结束词组成;
以及,
删除目标商品的广告标题的重复中间词。
8.一种自动生成广告标题的装置,包括:
细分类目获取模块,被配置为获取目标商品的细分类目词语;
广告标题生成模块,被配置为将目标商品的细分类目词语输入预先训练的神经网络进行处理,得到目标商品的广告标题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811018044.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种斜面贴片洗墙灯
- 下一篇:一种电池峰值功率的估计方法及装置