[发明专利]一种现实场景下的阅读综合行为的识别方法及系统有效
申请号: | 202010499715.1 | 申请日: | 2020-06-04 |
公开(公告)号: | CN111860122B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 范骁骏;高旻昱 | 申请(专利权)人: | 上海翎腾智能科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/146;G06V30/148;G06T7/13;G06V30/19;G06V10/82 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 现实 场景 阅读 综合 行为 识别 方法 系统 | ||
本发明涉及阅读综合行为识别的技术领域,提供了一种现实场景下的阅读综合行为的识别方法及系统,其方法包括:S1:获取真实阅读场景下的信息载体图像;S2:对信息载体图像进行定位和边缘位置检测,对书本内部的图像内容进行检测,实现对翻页行为的识别;S3:针对页面范围内的信息进行随机采样,对候选焦点语言特征点图片组进行综合分析,实现对焦点页面语言的识别;S4:对行的信息进行定位,获得行数和每一行的行宽,估算出每一行的文字数量和页面内的文字总数量;S5:获取两次翻页事件之间的时间间隔内阅读文字的总数量,计算出单位时间内的阅读文字总量。能够对读者的阅读行为,尤其是针对于阅读纸质书本的阅读行为进行实时的分析。
技术领域
本发明涉及阅读综合行为识别的技术领域,尤其涉及一种现实场景下的阅读综合行为的识别方法及系统。
背景技术
在当前的人工智能技术领域中,人类在阅读书本时,经常会与人工智能进行交互,以利于通过书本进行学习时,能够学习理解的更快,人工智能也能够对人类的阅读行为进行分析,后续推荐一个与读者更加适应的学习计划。
此时,就涉及到需要对读者的阅读行为进行分析,在现有技术中,并没有找到一种合适的方法能够识别并分析读者的阅读行为。
市面上,能够分析读者阅读行为的应用背景,基本上都是基于电子阅读设备来提供给读者进行阅读,通过电子设备阅读的记录来分析阅读行为。然而,很多时候,我们还是需要通过传统的纸质书本进行阅读学习,如何分析纸质书本的阅读行为,就很难了。
在“CN103186665A-一种纸质图书数字化辅助阅读软件”中,公开:“提出了一种纸质图书数字化辅助阅读软件。通过该软件的使用可以减少实体书签的使用,以及实体书签丢失带来的不便;可以为图书添加更为丰富的书签、并能够对书签进行检索;可提高阅读公共书籍的效率和质量,提供了解决无法在公共书籍上注释的一种数字化方法;了解自己阅读的习惯、每本书阅读所花费的时间;实现纸质图书与电子图书同时期阅读的连续性。该辅助阅读软件的功能包括:图书识别、数字化当前阅读状态、纸质图书数字化书签、纸质图书数字化笔记、图书纸质版与电子版连续阅读、纸质图书阅读行为统计。该软件包含Android、iOS、Windows Phone版本,可运行于安装了上述操作系统的智能移动设备上。使用该软件时,设备上必须包含或连接有摄像头装置。该系统包括以下模块:图书识别模块:通过摄像头装置对图书的ISBN条形码进行扫描,获得其ISBN编号。软件中所涉及的图书主要通过该ISBN编号进行识别,无须用户输入。信息管理模块:软件相关数据的存储及检索,以及通过网络获取图书的基本信息。PDF文档阅读模块:实现简单的PDF文档显示并能保存当前阅读页码。图片编辑模块:包含可选尺寸及颜色的画笔、以及添加文字功能。数字化当前阅读状态:当用户开始或结束图书的某一次阅读时,可通过该模块对当前的阅读页码进行提取和保存。每次的提取和保存行为会被记录,当前页码在每次保存时得到更新。通过图书识别模块对图书进行自动识别,但当前阅读的页码需要用户自行输入。纸质图书数字化书签:当用户需要添加书签时,可通过该模块向系统中添加该图书的数字化书签信息。数字书签信息包含该书的ISBN编码、页码、书签标题、注释。通过图书识别模块对图书进行自动识别,但其他信息需要用户输入。纸质图书数字化笔记:当用户需要在图书上添加注释或者进行标记时,可以通过摄像头装置将需要的书中内容拍摄下来,用户直接在拍摄下来的图片上进行注释货标记。图书纸质版与电子版连续阅读:当电子版图书与纸质版图书的页码顺序相同,两者使用同一个当前阅读状态,当前阅读状态会自动得到同步。当使用不同的阅读介质后,能够继续之前的阅读,以实现连续阅读。纸质图书阅读行为统计:通过每次阅读状态提取和保存行为信息进行阅读行为统计分析,可统计的用户的阅读信息包括:每本书的阅读时间分布、总花费的时间、每次的阅读时长、平均每次阅读所花费的时间。”上述技术方案中,虽然涉及到对阅读行为的识别,但是需要在电子设备中同时保存一个对应的电子版的书籍,实质上,所有的识别动作都是基于电子版的数据来进行的。且对阅读行为进行统计时,仅仅只是统计了每本书的阅读时间分布、总花费的时间,每次的阅读时长,平均每次阅读时间。无法针对于阅读时的实时的阅读的速度进行分析,统计的只是一个大概的时间,是一个不准确的阅读时间,后续也不能够根据阅读速度推荐一个适应的学习计划。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海翎腾智能科技有限公司,未经上海翎腾智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010499715.1/2.html,转载请声明来源钻瓜专利网。