[发明专利]一种文档处理方法、装置、电子设备及可读存储介质有效
申请号: | 202010505526.0 | 申请日: | 2020-06-05 |
公开(公告)号: | CN112784594B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 冷志峰 | 申请(专利权)人: | 珠海金山办公软件有限公司;北京金山办公软件股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/237;G06F40/106;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;高莺然 |
地址: | 519015 广东省珠海市高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 处理 方法 装置 电子设备 可读 存储 介质 | ||
1.一种文档处理方法,其特征在于,应用于电子设备,所述方法包括:
确定所展示的文档页面;
确定所述文档页面所包含的专有名词;其中,所述专有名词是基于预先构建的识别模型对所述文档页面进行识别后得到的;
获得所述文档页面所包含的专有名词的解释;
在所述文档页面的空白处显示所述专有名词所对应的悬浮框;其中,所述悬浮框中显示有所述专有名词的解释;所述悬浮框按照由上往下、由下往上、由左至右或由右至左移动中的任一方式进行动态展示;
当所述文档页面为图片类型的文档页面时,所述识别模型具体用于通过光学字符识别的方式提取所述文档页面中所包含的文字、再通过词到向量算法对所述文字进行分词,得到所述文字中所包含的词汇,并识别所述词汇中的专有名词;
在所述确定所述文档页面所包含的专有名词的步骤之前,还包括:
获得预设的文档页面和所述预设的文档页面中记录的目标专有名词;
利用神经网络算法对训练样本进行训练,得到所述识别模型;其中,一个训练样本中包括:一个预设的文档页面以及该预设的文档页面中所记录的目标专有名词;
在所述确定所述文档页面所包含的专有名词的步骤之前,还包括:
判断所述文档页面的展示时间是否超过预设阈值;
若是,触发所述确定所述文档页面所包含的专有名词的步骤。
2.根据权利要求1所述的方法,其特征在于,所述确定所述文档页面所包含的专有名词的步骤,包括:
将所述文档页面输入至预先构建的识别模型,得到所述文档页面所包含的专有名词的解释;其中,所述识别模型用于识别所述文档页面中的词汇并识别所述词汇中的专有名词。
3.根据权利要求1所述的方法,其特征在于,所述确定所述文档页面所包含的专有名词的步骤,包括:
将所述文档页面发送给服务器,以使所述服务器基于所述识别模型识别所述文档页面中的词汇,识别并输出所述词汇中的专有名词;
接收所述服务器发送的所述专有名词。
4.根据权利要求1所述的方法,其特征在于,所述获得所述文档页面所包含的专有名词的解释的步骤,包括:
查找预设词条库中与所述专有名词相匹配的词条名;
获得所述词条库中与所述词条名所对应的解释。
5.一种文档处理装置,其特征在于,应用于电子设备,包括:
第一确定模块,用于确定所展示的文档页面;
第二确定模块,用于确定所述文档页面所包含的专有名词;其中,所述专有名词是基于预先构建的识别模型对所述文档页面进行识别后得到的;
第一获得模块,用于获得所述文档页面所包含的专有名词的解释;
显示模块,用于在所述文档页面的空白处显示所述专有名词所对应的悬浮框;
其中,所述悬浮框中显示有所述专有名词的解释;所述悬浮框按照由上往下、由下往上、由左至右或由右至左移动中的任一方式进行动态展示;
当所述文档页面为图片类型的文档页面时,所述识别模型具体用于通过光学字符识别的方式提取所述文档页面中所包含的文字、再通过词到向量算法对所述文字进行分词,得到所述文字中所包含的词汇,并识别所述词汇中的专有名词;
所述装置还包括:第二获得模块,用于在确定文档页面所包含的专有名词之前,获得预设的文档页面和所述预设的文档页面中记录的目标专有名词;
训练模块,用于利用神经网络算法对训练样本进行训练,得到所述识别模型;其中,一个训练样本中包括:一个预设的文档页面以及该预设的文档页面中所记录的目标专有名词;
判断模块,用于在确定所述文档页面所包含的专有名词之前,判断所述文档页面的展示时间是否超过预设阈值;
触发模块,用于在所述文档页面的展示时间超过预设阈值时,触发所述第二确定模块。
6.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4中任一所述的方法步骤。
7.一种可读存储介质,其特征在于,所述可读存储介质为电子设备中的可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被所述电子设备的处理器执行时实现权利要求1-4中任一所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山办公软件有限公司;北京金山办公软件股份有限公司,未经珠海金山办公软件有限公司;北京金山办公软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010505526.0/1.html,转载请声明来源钻瓜专利网。