[发明专利]电子缩略书生成方法、电子设备及计算机存储介质有效
申请号: | 201711447391.1 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108108447B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 郑志伟;车红茜;张倩;孔鹏;杨喜娜;索珊珊 | 申请(专利权)人: | 掌阅科技股份有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/253;G06F40/289 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 100023 北京市朝阳区四惠东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 缩略 书生 成方 电子设备 计算机 存储 介质 | ||
1.一种电子缩略书生成方法,包括:
确定电子书中包含的各词语,以及各词语的词性;
依据用户操作确定目标缩略等级;
依据预先确定的候选缩略等级与候选缩略规则之间的关联关系确定所述目标缩略等级所关联的目标缩略规则;其中,所述目标缩略规则由用户选择的符合自身需求的缩略程度对应的目标缩略等级确定,所述候选缩略等级的缩略程度确定了所需删减的词语的词性,候选缩略等级越高,所需删减的词语的词性越多;其中,所述用户操作包括以下至少一项:设定篇幅长度缩略为原文的比例值、设定篇幅缩减级别、设定缩减范围、设定指定部分内容的缩减程度;
采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。
2.根据权利要求1所述的方法,其中,确定电子书中包含的各词语,以及各词语的词性,包括:
对所述电子书进行分词得到所述电子书中包含的各词语;
依据预先基于隐马尔科夫模型训练生成的词性标注模型对所述电子书中包含的各词语进行词性标注。
3.根据权利要求1所述的方法,其中,依据用户操作确定目标缩略等级,包括:
获取用户从预设的至少一个候选缩略等级中选择的目标缩略等级。
4.根据权利要求1所述的方法,其中,依据用户操作确定目标缩略等级,包括:
获取用户设置的目标保留比例值;
从保留比例值大于所述目标保留比例值的候选缩略等级中选择一个作为第一目标缩略等级,从保留比例值小于所述目标保留比例值的候选缩略等级中选择一个作为第二目标缩略等级。
5.根据权利要求4所述的方法,其中,获取用户设置的目标保留比例值,包括:
依据用户输入的数字确定用户设置的目标保留比例值;或者,
依据用户对比例轴的拖动操作,确定用户设置的目标保留比例值。
6.根据权利要求4所述的方法,其中,所述第一目标缩略等级与所述第二目标缩略等级为相邻的候选缩略等级。
7.根据权利要求4所述的方法,其中,采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书,包括:
采用所述第一目标缩略等级所关联的第一目标缩略规则对全书作删减处理;
从所述电子书中选择N个章节,采用所述第二目标缩略等级所关联的第二目标缩略规则对选择的N个章节作删减处理。
8.根据权利要求7所述的方法,其中,从所述电子书中选择N个章节,包括:
将所述电子书中除开头章节和结尾章节以外的其他章节作为候选章节;
从所述候选章节中选择N个章节。
9.根据权利要求8所述的方法,其中,从所述候选章节中选择N个章节,包括:
从各所述候选章节中随机选择一个章节作为起始章节;
以所述起始章节为起点,连续选择N个章节。
10.根据权利要求8所述的方法,其中,从所述候选章节中选择N个章节,包括:
依据用户对各所述候选章节的阅读行为,从各所述候选章节中选择非热门章节;
从选择的非热门章节中选择N个章节。
11.根据权利要求7-10中任一项所述的方法,其中,从所述电子书中选择的章节数量N通过如下公式确定:
N=N总×(b1-b3)/(b2-b1)
其中,N总是所述电子书的总章节数,b1是所述第一目标缩略等级的保留比例值,b2是所述第二目标缩略等级的保留比例值,b3是所述目标保留比例值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711447391.1/1.html,转载请声明来源钻瓜专利网。