[发明专利]自动识别和显示图形小说中的感兴趣对象有效
申请号: | 201680085828.9 | 申请日: | 2016-12-21 |
公开(公告)号: | CN109155076B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 格雷格·哈特雷尔;加思·康博伊;布拉迪·杜加;辜新星;阿德琳·比瓦尔斯;德巴基特·高什;约翰·里夫林;艾伦·纽伯格;安泰完;雅各布·穆恩;克里斯托弗·萨尔瓦拉尼;卡尔·布拉斯 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动识别 显示 图形 小说 中的 感兴趣 对象 | ||
识别数字图形小说内容中的感兴趣对象(例如,对话泡泡)的位置和呈现顺序,使得能够将感兴趣对象的扩展版本呈现给读者。具体地,接收数字图形小说内容,并且通过将机器学习模型应用于内容来识别内容中的感兴趣区域(例如,对话泡泡的矩形文本区域)的位置。基于所识别的感兴趣区域的位置来识别数字图形小说内容中的感兴趣对象的位置和呈现顺序。将包括感兴趣对象的位置和呈现顺序的数字图形小说内容和呈现元数据被提供给阅读设备,使得根据呈现元数据向用户呈现感兴趣对象的扩展版本。
技术领域
这里描述的主题一般涉及数字图形小说,并且尤其涉及在数字图形小说内容中提供感兴趣对象的导航。
背景技术
电子书(“电子书”)以各种格式,诸如国际数字出版论坛的电子出版物(EPUB)标准和便携式文档格式(PDF)出现。能够使用各种设备,诸如专用阅读设备、通用移动设备、平板计算机、膝上型计算机和台式计算机,来阅读电子书。每个设备包括向用户显示电子书的阅读软件(“电子阅读器”)。图形小说是传统上通过印刷媒体传递的视觉叙事形式。但是,出版商越来越多地使用电子阅读器为数字消费提供此内容,尤其是在手机和平板计算机上。主要考虑到基于文本的电子书来开发通过典型的电子阅读器提供的导航工具。因此,当被用于阅读数字图形小说时,这些电子阅读器可能无法提供令人满意的用户体验。
由于对便携式电子阅读器的屏幕尺寸和分辨率的限制,如果以传统方式为用户呈现小说,则用户经常具有导航图形小说的不令人满意的体验。例如,可能需要电子书阅读器的用户翻阅在电子书阅读器的相对小的屏幕上显示的图形小说的各个页面。在这种情况下,对于用户来说在不必重复地放大和缩小感兴趣的对象的情况下阅读对话泡泡中的文本或更详细地检查其他感兴趣的对象是困难和耗时的。
发明内容
通过方法、电子设备和非暂时性计算机可读存储介质解决上述和其他问题。在一个实施例中,该方法包括接收数字图形小说内容并且通过将机器学习模型应用于数字图形小说内容识别数字图形小说内容的多个感兴趣区域的位置。该方法还包括基于所述多个感兴趣区域的所识别的位置识别数字图形小说内容中的多个感兴趣对象的位置和呈现顺序,以及创建包括数字图形小说内容和呈现元数据的打包的数字图形小说。呈现元数据指示所述多个感兴趣对象的所识别的位置和呈现顺序。该方法还包括将打包的数字图形小说提供给阅读设备,用于根据呈现元数据呈现所述多个感兴趣对象的扩展版本。
在一个实施例中,电子设备包括存储可执行的计算机程序代码的非暂时性计算机可读存储介质和用于执行代码的一个或多个处理器。可执行计算机程序代码包括用于接收数字图形小说内容并且通过将机器学习模型应用于数字图形小说内容来识别数字图形小说内容的多个感兴趣区域的位置的指令。该指令还包括基于所述多个感兴趣区域的所识别的位置识别数字图形小说内容中的多个感兴趣对象的位置和呈现顺序,并且创建包括数字图形小说内容和呈现元数据的打包的数字图形小说。呈现元数据指示所述多个感兴趣对象的所识别的位置和呈现顺序。该指令还包括将打包的数字图形小说提供给阅读设备,用于根据呈现元数据呈现所述多个感兴趣对象的扩展版本。
在一个实施例中,非暂时性计算机可读存储介质存储可执行计算机程序代码,该可执行计算机程序代码包括用于接收数字图形小说内容并且通过将机器学习模型应用于数字图形小说内容来识别数字图形小说内容的多个感兴趣区域的位置的指令。该指令还包括基于多个感兴趣区域的所识别的位置识别数字图形小说内容中的多个感兴趣对象的位置和呈现顺序,并且创建包括数字图形小说内容和呈现元数据的打包的数字图形小说。呈现元数据指示多个感兴趣对象的所识别的位置和呈现顺序。该指令还包括将打包的数字图形小说提供给阅读设备,用于根据呈现元数据呈现多个感兴趣对象的扩展版本。
附图说明
图1图示适用于在数字图形小说内容中提供感兴趣对象的导航的联网计算环境的一个实施例。
图2是图示根据一个实施例的用于在图1的联网计算环境中使用的计算机的示例的高级框图。
图3是图示图1中所示的图形小说语料库的一个实施例的高级框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680085828.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:适配3D打印文件
- 下一篇:渐进渲染的体积光线追踪