[发明专利]题录生成方法和装置、以及计算机系统和可读存储介质有效

专利信息
申请号: 202010607299.2 申请日: 2020-06-29
公开(公告)号: CN111767719B 公开(公告)日: 2023-08-22
发明(设计)人: 张玉芳;李小婉;邵世臣;李永恒 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F40/258 分类号: G06F40/258;G06F40/211;G06F40/253;G06F40/289;G06F40/30;G06N3/08
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 吕朝蕙
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 生成 方法 装置 以及 计算机系统 可读 存储 介质
【说明书】:

本公开提供了一种利用自然语言处理技术和深度学习模型来生成数字内容的题录的方法,涉及人工智能领域,具体涉及自然语言处理和深度学习技术。该方法包括:获取文本的属性信息;利用预定提取模型提取文本的关键信息;以及根据属性信息和关键信息,利用预定题录模型生成针对文本的题录。本公开还提供了一种题录生成装置、一种计算机系统以及一种计算机可读存储介质。

技术领域

本公开涉及人工智能领域,具体涉及自然语言处理和深度学习技术,更具体地,涉及一种利用自然语言处理技术和深度学习模型来生成数字内容的题录的方法和装置、以及计算机系统和可读存储介质。

背景技术

随着互联网技术的发展,数字内容指数增加。但由于互联网具有开放性和虚拟性等特征,导致借助于互联网产生的数字内容可以被随意复制和更改。

在实现本公开构思的过程中,发明人发现相关技术中至少存在以下问题:为了避免数字内容中的文本被随意复制和更改,可以通过向文本添加电子水印、数字签名及撰写题录等方式来对文本进行保护。例如,在采用撰写题录的方式时,可以仅向用户展示文本的题录,在用户对文本进行实名购买后才可浏览文本的全文信息。相关技术中,题录往往通过人工撰写的方式来生成,存在题录撰写效率低、无法快速覆盖大批量文本的缺陷。再者,人工撰写的题录往往具有主观色彩,因此可能存在生成的题录不精准的问题。

发明内容

有鉴于此,本公开提供了一种能够批量、自动生成题录的题录生成方法和装置、以及计算机系统和可读存储介质。

本公开的一个方面提供了一种题录生成方法,该方法包括:获取文本的属性信息;利用预定提取模型提取文本的关键信息;以及根据属性信息和关键信息,利用预定题录模型生成针对文本的题录。

可选地,上述题录生成方法还包括:获取用户的历史操作信息,历史操作信息包括用户在检索历史文本时使用的m个检索字段;根据m个检索字段的使用频率自高至低,对m个检索字段进行排序;以及将已排序的m个检索字段作为m个第一题录字段,确定预定题录模型,其中,m为大于等于2的整数。

可选地,历史操作信息还包括用户对于多个历史文本中每个历史文本的浏览记录;上述题录生成方法还包括:获取多个历史文本中每个历史文本的题录,得到多个题录,每个题录包括多个题录字段;根据多个题录,从多个题录包括的题录字段中确定n个第二题录字段;确定预定题录模型包括:根据m个第一题录字段和n个第二题录字段,确定所述预定题录模型,其中,n为大于等于2的整数。

可选地,确定预定题录模型包括:根据每个历史文本的浏览记录,确定n个第二题录字段中每个第二题录字段的浏览频率;根据浏览频率自高至低,依次向n个第二题录字段分配自高至低的第二加权评估值w2*bi;向已排序的m个第一题录字段分配自高至低的第一加权评估值w1*aj;以及根据第一加权评估值和第二加权评估值,对m个第一题录字段和n个第二题录字段根据加权评估值自高至低排序,构成预定题录模型,其中,i为大于等于1且小于等于n的整数,j为大于等于1且小于等于m的整数;w1、w2分别为第一权重和第二权重,且w1小于w2;bi为n个第二题录字段中第i个题录字段的评估值;aj为m个第一题录字段中第j个题录字段的评估值。

可选地,利用预定题录模型生成针对文本的题录包括:利用预定语言模型,根据关键信息生成针对文本的描述信息;以及将属性信息和描述信息添加至预定题录模型的预定位置,生成针对文本的题录。

可选地,属性信息包括针对文本的统计指标;利用预定题录模型生成针对文本的题录包括:根据统计指标,利用预定评价模型确定文本的价值度;以及根据价值度、属性信息和关键信息,利用预定题录模型生成针对文本的题录。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010607299.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top