[发明专利]用于生成信息的方法和装置有效
申请号: | 201810128692.6 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108228906B | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 江航;刘明浩;宋凯华;梁阳;乔爽爽;安思宇;林湘粤;柴华;张发恩;郭江亮;黄靖博;李旭;唐进;尹世明 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/27 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选信息 预设 方法和装置 生成信息 推荐信息 获取目标 目标网页 目标文本 集合 文本 申请 | ||
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:从目标网页上获取目标文本;提取目标文本的至少一个关键词;从至少一个关键词中确定第一预设数量个关键词,以及从预设的第一候选信息集合中,确定至少一个第一候选信息,其中,所确定的至少一个第一候选信息中的每个第一候选信息包括第一预设数量个关键词;对于至少一个第一候选信息中的每个第一候选信息,生成针对该第一候选信息的第一待推荐信息。该实施方式提高了生成推荐信息的针对性。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于生成信息的方法和装置。
背景技术
随着互联网技术的发展,人们通过网络获取的信息的种类和数量越来越多,因此,当前出现了很多向用户推荐信息的方法。推荐系统的冷启动,是指对于新用户,系统缺乏足够的数据来捕获用户的兴趣并有效地推荐内容。现有的推荐冷启动方法主要有根据用户注册信息进行推荐,比如根据用户的年龄,给他/她推荐自身年龄段都比较喜欢的物品,同时让用户给予显性反馈;或者给用户推荐自有数据集合中的新数据等。
发明内容
本申请实施例提出了用于生成信息的方法和装置。
第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:从目标网页上获取目标文本;提取目标文本的至少一个关键词;从至少一个关键词中确定第一预设数量个关键词,以及从预设的第一候选信息集合中,确定至少一个第一候选信息,其中,所确定的至少一个第一候选信息中的每个第一候选信息包括第一预设数量个关键词;对于至少一个第一候选信息中的每个第一候选信息,生成针对该第一候选信息的第一待推荐信息。
在一些实施例中,提取目标文本的至少一个关键词,还包括:确定至少一个关键词中的每个关键词的权重值;以及从至少一个关键词中确定第一预设数量个关键词,包括:按照关键词的权重值由大到小的顺序,从至少一个关键词中确定第一预设数量个关键词。
在一些实施例中,生成针对该第一候选信息的第一待推荐信息,还包括:确定所生成的第一待推荐信息的推荐权重。
在一些实施例中,确定所生成的第一待推荐信息的推荐权重,包括:获取该第一候选信息的发布时间;基于所获取的发布时间,确定该第一候选信息对应的第一待推荐信息的推荐权重。
在一些实施例中,在对于至少一个第一候选信息中的每个第一候选信息,生成针对该第一候选信息的第一待推荐信息之后,方法还包括:获取预设的第二待推荐信息集合,以及确定第二待推荐信息的推荐权重,其中,第二待推荐信息为针对第二候选信息的推荐信息;从第二待推荐信息集合中,确定对应的第二候选信息包括第一预设数量个关键词的第二待推荐信息;将所生成的第一待推荐信息的集合和所确定的第二待推荐信息的集合的并集确定为第三待推荐信息集合,以及确定第三待推荐信息的推荐权重;按照第三待推荐信息的推荐权重由大到小的顺序,从第三待推荐信息集合中,提取第二预设数量个第三待推荐信息。
在一些实施例中,确定第三待推荐信息的推荐权重,包括:对于第三待推荐信息集合中的每个第三待推荐信息,响应于确定所生成的第一待推荐信息的集合和所确定的第二待推荐信息的集合均包括该第三待推荐信息,获取与该第三待推荐信息相同的第一待推荐信息的推荐权重和与该第三待推荐信息相同的第二待推荐信息的推荐权重,以及根据所获取的推荐权重确定该第三待推荐信息的推荐权重。
第二方面,本申请实施例提供了一种用于生成信息的装置,该装置包括:第一获取单元,配置用于从目标网页上获取目标文本;第一提取单元,配置用于提取目标文本的至少一个关键词;第一确定单元,配置用于从至少一个关键词中确定第一预设数量个关键词,以及从预设的第一候选信息集合中,确定至少一个第一候选信息,其中,所确定的至少一个第一候选信息中的每个第一候选信息包括第一预设数量个关键词;生成单元,配置用于对于至少一个第一候选信息中的每个第一候选信息,生成针对该第一候选信息的第一待推荐信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810128692.6/2.html,转载请声明来源钻瓜专利网。