[发明专利]预估文本阅读时间的方法、装置、电子设备及存储介质在审
申请号: | 201910979620.7 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110807313A | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 苏汉;张金超;牛成;周杰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06Q10/04 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 王鹏健 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预估 文本 阅读 时间 方法 装置 电子设备 存储 介质 | ||
1.一种预估文本阅读时间的方法,其特征在于,所述方法包括:
确定待处理的目标文本所包含的文本内容及各个语句;
基于所述文本内容及所述各个语句,计算所述目标文本的信息量;
获取用户的信息量阅读速率;
基于所述目标文本的信息量及所述信息量阅读速率,预估所述用户对所述目标文本的阅读时间。
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本内容及所述各个语句,计算所述目标文本的信息量,包括:
获取所述文本内容中每个词语的词向量;
基于所述文本内容中每个词语的词向量、所述各个语句所包含的词语及预设的凸包算法,分别计算所述各个语句的凸包体积;
计算所述各个语句的凸包体积之和,根据所述凸包体积之和确定所述目标文本的信息量。
3.根据权利要求2所述的方法,其特征在于,所述获取所述文本内容中每个词语的词向量,包括:
对所述文本内容进行分词,得到所述文本内容的分词结果;
基于预训练的词向量模型对所述分词结果进行处理,得到所述文本内容中每个词语的词向量。
4.根据权利要求1所述的方法,其特征在于,所述基于所述文本内容及所述各个语句,计算所述目标文本的信息量,包括:
根据所述文本内容及所述各个语句,确定所述文本内容的文本长度和目标文本所包含的语句个数;
计算所述文本长度与所述语句个数的乘积,根据所述文本长度与所述语句个数的乘积确定所述目标文本的信息量。
5.根据权利要求1所述的方法,其特征在于,所述基于所述文本内容及所述各个语句,计算所述目标文本的信息量,包括:
基于所述文本内容及所述各个语句,确定所述目标文本的信息密度和所述文本内容的文本长度;
计算所述信息密度与所述文本长度的乘积,根据所述信息密度与所述文本长度的乘积确定所述目标文本的信息量。
6.根据权利要求5所述的方法,其特征在于,所述基于所述文本内容及所述各个语句,确定所述目标文本的信息密度,包括:
根据所述文本内容及所述各个语句,确定所述目标文本的指定片段所包含的文本内容和语句;
基于所述指定片段所包含的文本内容及语句,计算所述指定片段的信息量;
计算所述指定片段的信息量与所述指定片段所包含的文本内容的文本长度之间的比值,根据所述比值确定所述目标文本的信息密度。
7.根据权利要求1所述的方法,其特征在于,所述获取用户的信息量阅读速率,包括:
获取用户的历史阅读文本的信息量及用户对所述历史阅读文本的阅读时间;
基于所述历史阅读文本的信息量及所述阅读时间,获取用户的信息量阅读速率。
8.根据权利要求1所述的方法,其特征在于,所述获取用户的信息量阅读速率,包括:获取各个用户的信息量阅读速率;
所述基于所述目标文本的信息量及所述信息量阅读速率,预估所述用户对所述目标文本的阅读时间,包括:基于所述目标文本的信息量及所述各个用户的信息量阅读速率,预估所述各个用户对所述目标文本的阅读时间。
9.根据权利要求1所述的方法,其特征在于,所述获取用户的信息量阅读速率,包括:获取目标用户集群的信息量阅读速率;
所述基于所述目标文本的信息量及所述信息量阅读速率,预估所述用户对所述目标文本的阅读时间,包括:基于所述目标文本的信息量及所述目标用户集群的信息量阅读速率,预估所述目标用户集群中的各个用户对所述目标文本的阅读时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910979620.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:脱硫塔
- 下一篇:图像处理网络的训练方法、图像去噪方法及装置