[发明专利]打标签方法、推荐方法及记录介质有效
申请号: | 201910423246.2 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110147499B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 张炜 | 申请(专利权)人: | 智者四海(北京)技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/216;G06F40/289;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 杨奇松 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 方法 推荐 记录 介质 | ||
1.一种打标签方法,包括:
从目标内容的文本部分选择多个关键词;其中,通过kafka队列在线获取的新内容作为目标内容;
使用语言模型确定各关键词的相应关键词向量;
通过对各相应关键词向量加权求和确定所述目标内容的内容向量;
基于所述内容向量和标签集中的各标签的标签向量确定所述目标内容关于各标签的相似度;以及
基于各相似度确定所述目标内容的内容类别标签;
其中,所述标签集中的各标签为指示所述目标内容的候选类别的类别指示词;并且
各标签向量是由所述语言模型基于相应类别指示词确定的向量;
其中,通过对各相应关键词向量加权求和确定所述目标内容的内容向量包括:
确定各关键词的类别;以及基于各关键词的类别确定各相应关键词向量的相应权重;
其中,所述类别选自于由以下构成的类别组:商品、人名、地名、数字、时间和其他;
当所述类别为商品时,所述相应权重为第一值;
当所述类别为其他时,所述相应权重为第二值;
当所述类别为人名、地名、数字或时间时,所述相应权重为第三值;
所述第一值大于所述第二值;并且
所述第二值大于所述第三值。
2.根据权利要求1所述的打标签方法,其中,所述标签集中的各标签选自二级行业类别。
3.根据权利要求1所述的打标签方法,其中,从目标内容的文本部分选择多个关键词包括:
对所述文本部分进行分词以得到多个候选关键词;
确定各候选关键词的关于所述文本部分的词频;
确定各候选关键词的关于预定语料库的逆文档频率;以及
基于各候选关键词的词频与逆文档频率的积选择预定数量的候选关键词作为所述多个关键词。
4.根据权利要求1所述的打标签方法,其中,所述语言模型是针对预定语料库使用word2vec工具训练后的自然语音处理模型。
5.一种推荐方法,包括:
基于多个内容中的每个的内容类别标签集和用户的感兴趣内容类别集确定用于向所述用户推荐的候选内容集;
从候选内容集选择向所述用户推荐的推荐内容;以及
生成向所述用户显示所述推荐内容的表示的指示;
其中,所述指示用于供所述用户选择;并且
所述多个内容包括目标内容,所述目标内容的内容类别标签集中的至少一个内容类别标签是通过权利要求1至4中的任一项所述的打标签方法来被确定。
6.根据权利要求5所述的推荐方法,还包括:使用kafka队列获取最新内容作为所述目标内容。
7.一种存储有程序的计算机可读记录介质,其中,所述程序使计算机执行权利要求1至4中的任一项所述的打标签方法。
8.一种存储有程序的计算机可读记录介质,其中,所述程序使计算机执行权利要求5或6所述的推荐方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智者四海(北京)技术有限公司,未经智者四海(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910423246.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识推送方法、装置及存储设备、程序产品
- 下一篇:一种信息推荐方法及装置