[发明专利]一种兴趣点信息的获取方法及装置、推送方法及装置有效
申请号: | 201410404790.X | 申请日: | 2014-08-15 |
公开(公告)号: | CN104133918B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 崔代锐;徐明泉;邝卓聪;黄绍建;秦敏;王玉瑶;王岳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F17/27 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 兴趣 信息 获取 方法 装置 推送 | ||
本发明实施例提供了一种兴趣点信息的获取方法,包括:利用兴趣点词表,对语料库中文档中的文本信息进行识别,以获得第一兴趣点序列,所述第一兴趣点序列包含所述文档所包含的至少两个候选兴趣点;对所述至少两个候选兴趣点进行数目调整,和/或,对所述至少两个候选兴趣点进行顺序调整,以获得第二兴趣点序列,将所述第二兴趣点序列作为与所述文档相匹配的兴趣点序列;本发明实施例还提供一种兴趣点信息的获取装置、推送方法及装置。根据本发明实施例提供的技术方案,可以实现提高兴趣点信息的获取效率。
【技术领域】
本发明涉及互联网应用技术,尤其涉及一种兴趣点信息的获取方法及装置、推送方法及装置。
【背景技术】
目前,网页中的文档,如游记,很多都包含长篇的文本信息,且内容丰富,使得用户需要花费大量的阅读时间才能获取到有用信息,因此获取成本较高。
针对上述问题,有些服务器可以通过设置用户生成内容(User GeneratedContent,UGC)模板,让用户依据该UGC模板输入文档的摘要信息,例如,对于用户上传的游记,就可以让用户输入该游记对应的兴趣点信息,如用户先后到达过哪些景点、餐馆等兴趣点,这样就可以获取到游记对应的兴趣点信息,在显示游记时可以同时显示兴趣点信息。然而,这种获取方式依赖于用户的行为,如果用户不主动输入兴趣点信息,服务器将无法获取兴趣点信息,导致目前兴趣点信息的获取效率比较低。
【发明内容】
有鉴于此,本发明实施例提供了一种兴趣点信息的获取方法及装置、推送方法及装置,可以实现提高兴趣点信息的获取效率。
本发明实施例提供了一种兴趣点信息的获取方法,包括:
利用兴趣点词表,对语料库中文档中的文本信息进行识别,以获得第一兴趣点序列,所述第一兴趣点序列包含所述文档所包含的至少两个候选兴趣点;
对所述至少两个候选兴趣点进行数目调整,和/或,对所述至少两个候选兴趣点进行顺序调整,以获得第二兴趣点序列,将所述第二兴趣点序列作为与所述文档相匹配的兴趣点序列。
上述方法中,所述利用兴趣点词表,对语料库中文档中的文本信息进行识别,以获得第一兴趣点序列,包括:
获得语料库中的文档;
对所述文档中的文本信息进行切词,以获得至少两个分词;
利用所述兴趣点词表对所述至少两个分词进行兴趣点识别处理,以获得所述文档所包含的至少两个候选兴趣点。
上述方法中,所述对所述至少两个候选兴趣点进行数目调整,以获得第二兴趣点序列,包括:
获得每个所述候选兴趣点在所述文本信息中的出现次数;
获得出现次数小于预设的第一次数阈值的候选兴趣点,以作为干扰兴趣点;
在所述第一兴趣点序列中去除所述干扰兴趣点,以获得所述第二兴趣点序列。
上述方法中,所述对所述至少两个候选兴趣点进行数目调整,以获得第二兴趣点序列,包括:
获得每个所述候选兴趣点的归属地信息;
获得每个所述归属地信息的出现次数;
获得出现次数小于预设的第二次数阈值的归属地信息;
在所述第一兴趣点序列中去除所述出现次数小于预设的第二次数阈值的归属地信息对应的候选兴趣点,以获得所述第二兴趣点序列。
上述方法中,所述对所述至少两个候选兴趣点进行数目调整,以获得第二兴趣点序列,包括:
利用图像识别技术对所述文档中的至少一个图片信息进行识别,以获得每个所述图片信息所对应的兴趣点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410404790.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置