[发明专利]在内容中添加链接的方法和设备有效
申请号: | 201310414978.8 | 申请日: | 2013-09-12 |
公开(公告)号: | CN103455620A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 王维维 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张川绪;薛义丹 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 添加 链接 方法 设备 | ||
技术领域
本发明涉及计算机网络领域。更具体地讲,涉及一种在内容中添加链接的方法和设备。
背景技术
随着信息技术的发展,越来越多的内容出现在网络中,供网络用户进行浏览。然而,用户在浏览内容时,可能遇到一些不熟悉的信息,或者希望对一些信息做进一步了解。这时,通常需要将这些信息复制或输入到搜索引擎,然后通过搜索引擎来检索这些信息。
解决上述问题的一个方案是在内容中对这些信息添加链接(例如,超级链接),从而用户可以通过这些链接来访问相应的信息,而不需要另外进行搜索。
然而,在现有技术中,为了在内容中添加链接,通常需要人工来完成链接的添加,成本较高,并且效率较低。另外,人工添加链接受添加操作的执行人员的主观因素和背景知识的影响也较大,导致添加的链接的质量参差不齐,并且无法准确反映网络用户对链接的一般需要。因此,需要一种能够在内容中自动添加链接并且添加的链接能够反映网络用户对链接的需要的链接添加技术。
发明内容
本发明的目的在于提供一种能够在内容中自动添加链接的技术,从而不要用人工进行链接的添加,并且能够反映网络用户对链接的需要。
本发明的一方面提供一种在内容中添加链接的方法,所述方法包括:对内容进行切词,以获得词语;从获得的词语确定待添加链接的候选;确定候选的类别;确定候选的上下文模式;当候选的类别与候选的上下文模式对应时,向候选添加链接。
可选地,上下文模式是指候选与候选在内容中的上下文之间的语法结构和/或语意结构。
可选地,从获得的词语确定待添加链接的候选的步骤包括:根据在内容中的原始次序对获得的词语进行组合,以得到至少一个第一组合,并且将获得的各个词语分别作为一个第一组合;从得到的第一组合之中选择存在于预定数据库中的第一组合作为候选。
可选地,从得到的第一组合之中选择存在于预定数据库中的第一组合作为候选的步骤还包括:当在选择的第一组合之中存在位置上重叠的第一组合时,从重叠的第一组合之中选择最长的第一组合作为候选。
可选地,向候选添加链接的步骤包括:当候选的类别与候选的上下文模式对应时,确定候选在内容中的上下文与候选在其他内容中的上下文的相似度;当确定的相似度大于预定阈值时,向候选添加链接。
可选地,向候选添加链接的步骤还包括:当确定的相似度不大于预定阈值时,不向候选添加链接。
可选地,确定候选在内容中的上下文与候选在其他内容中的上下文的相似度的步骤包括:获取候选在内容中的上下文与候选在其他内容中的上下文的重复词语;确定每个重复词语的语意表达能力;确定的语意表达能力之中最高的语意表达能力作为所述相似度。
可选地,所述其他内容具有所述候选并且所述候选已经在所述其他内容中被添加了链接。
本发明的另一方面提供一种在内容中添加链接的设备,包括:切词单元,对内容进行切词,以获得词语;候选确定单元,从获得的词语确定待添加链接的候选;类别分析单元,确定候选的类别;上下文模式确定单元,确定候选的上下文模式;链接添加单元,当确定的类别与确定的上下文模式对应时,向候选添加链接。
可选地,上下文模式是指候选与候选在内容中的上下文之间的语法结构和/或语意结构。
可选地,候选确定单元包括:组合单元,根据在内容中的原始次序对获得的词语进行组合,以得到至少一个第一组合,并且将获得的各个词语分别作为一个第一组合;选择单元,从得到的第一组合之中选择存在于预定数据库中的第一组合作为候选。
可选地,当在选择的第一组合之中存在位置上重叠的第一组合时,选择单元从重叠的第一组合之中选择最长的第一组合作为候选。
可选地,所述设备还包括:相似度确定单元,当候选的类别与候选的上下文模式对应时,确定候选在内容中的上下文与候选在其他内容中的上下文的相似度,其中,当确定的相似度大于预定阈值时,链接添加单元向候选添加链接。
可选地,当确定的相似度不大于预定阈值时,链接添加单元不向候选添加链接。
可选地,所述相似度表示候选在内容中的上下文与候选在其他内容中的上下文之间的重复词语的语意表达能力之中的最高语意表达能力。
可选地,所述其他内容具有所述候选并且所述候选已经在所述其他内容中被添加了链接。
根据本发明的在内容中添加链接的方法和设备,可以实现自动在内容中添加链接,从而可以避免了人工进行链接的添加,提高了效率。此外,根据本发明的在内容中添加链接的方法和设备在内容中所添加的链接能够反映网络用户对链接的需要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310414978.8/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法