[发明专利]内容查询方法和装置有效
申请号: | 201810719950.8 | 申请日: | 2018-07-03 |
公开(公告)号: | CN110737824B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 张梦 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/906 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 查询 方法 装置 | ||
本申请实施例公开了内容查询方法和装置。该方法的一具体实施方式包括:获取查询请求,查询请求包括基于对内容标签的需求生成的查询式;将查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出满足内容标签需求的目标互联网内容,其中,互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;推送目标互联网内容。该实施方式提升了内容定位精准度,提升了内容查询效率。
技术领域
本申请实施例涉及计算机技术领域,具体涉及数据分析技术领域,尤其涉及内容查询方法和装置。
背景技术
随着互联网技术的发展,产生了越来越多的互联网数据。如何从海量的互联网数据中精准地抓取需要的数据,是互联网技术领域中的一个重要研究方向。
目前的数据查询技术中,通常根据用户输入的查询词与互联网内容的匹配程度来确定查询结果。对查询词的可选词库或查询格式没有限制,用户输入查询词操作的自由度较大。由于互联网内容数据量庞大,每条互联网内容所包含的内容较多,查询过程中的匹配计算需要花费较多的时间。
发明内容
本申请实施例提出了内容查询方法和装置。
第一方面,本申请实施例提供了一种内容查询方法,包括:获取查询请求,所述查询请求包括基于从预设内容标签库中选择的目标内容标签生成的查询式;将所述查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出目标互联网内容,其中,所述互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;推送目标互联网内容。
在一些实施例中,上述方法还包括:将待分析的互联网内容输入预设的内容标签分类模型,得到用于表征待分析的互联网内容的内容特征的标签,作为所述互联网内容关联的内容标签。
在一些实施例中,上述方法还包括:构建所述内容标签分类模型,包括:基于已标注关联的内容标签的样本内容,采用机器学习方法对内容标签分类的初始模型进行训练,得到所述内容标签分类模型。
在一些实施例中,上述基于已标注关联的内容标签的样本内容,采用机器学习方法对内容标签分类的初始模型进行训练,得到所述内容标签分类模型,包括:在预设的内容库中查找出与所述样本内容相似的内容作为扩展内容,将所述样本内容关联的内容标签与对应的扩展内容相关联,得到扩展内容关联的内容标签,基于所述样本内容和与所述样本内容相似的扩展内容生成样本数据;将样本数据中的样本内容和与所述样本内容相似的扩展内容输入所述内容标签分类的初始模型进行标签分类,并比对所述内容标签分类的初始模型的标签分类结果与所述样本内容关联的内容标签和所述扩展内容关联的内容标签,基于比对结果迭代调整所述内容标签分类的初始模型的参数,使调整参数后的内容标签分类的初始模型的标签分类结果与所述样本内容关联的内容标签和所述扩展内容关联的内容标签的比对结果满足预设的收敛条件,得到训练完成的内容标签分类模型。
在一些实施例中,内容标签分类模型包括以下至少一项:内容生产者标签分类模型、内容主题标签分类模型、内容分类角度标签分类模型。
第二方面,本申请实施例提供了一种内容查询装置,包括:获取单元,被配置成获取查询请求,所述查询请求包括基于从预设内容标签库中选择的目标内容标签生成的查询式;匹配单元,被配置成将所述查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出目标互联网内容,其中,所述互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;推送单元,被配置成推送目标互联网内容。
在一些实施例中,上述装置还包括:分类单元,被配置成将待分析的互联网内容输入预设的内容标签分类模型,得到用于表征待分析的互联网内容的内容特征的标签,作为所述互联网内容关联的内容标签。
在一些实施例中,上述装置还包括:构建单元,被配置成按照如下方式构建所述内容标签分类模型:基于已标注关联的内容标签的样本内容,采用机器学习方法对内容标签分类的初始模型进行训练,得到所述内容标签分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810719950.8/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法