[发明专利]一种信息处理方法、装置、设备及存储介质在审
申请号: | 202010610857.0 | 申请日: | 2020-06-29 |
公开(公告)号: | CN113934696A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 张磊 | 申请(专利权)人: | 武汉斗鱼鱼乐网络科技有限公司 |
主分类号: | G06F16/172 | 分类号: | G06F16/172;G06F16/16;G06F16/955 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 430070 湖北省武汉市东湖新技术开发区软件园东路*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 设备 存储 介质 | ||
1.一种信息处理方法,其特征在于,包括:
在监测到处理信息的触发事件时,获取与所述触发事件对应的待处理信息的原始路径信息和目标路径信息;
以所述原始路径信息为入参参数,调用已构建完成的信息下载函数,根据所述信息下载函数的输出结果,得到已下载至本地内存中的已处理完成的已下载信息,其中,所述已下载信息包括内容信息、以及标题信息和/或作者信息;
以所述目标路径信息为入参参数,调用已构建完成的目录创建函数,根据所述目录创建函数的输出结果,得到本地硬盘中的已创建完成的文件目录;
以所述已下载信息和所述文件目录为入参参数,调用已构建完成的信息存储函数,以将所述已下载信息存储至所述文件目录下的待存储文件中。
2.根据权利要求1所述的方法,其特征在于,所述信息下载函数通过如下步骤实现信息下载功能:
基于所述原始路径信息下载所述待处理信息,并将已下载的所述待处理信息加载至所述本地内存中,得到已下载信息;
对所述已下载信息进行解码处理,根据解码处理结果更新所述已下载信息;
对所述已下载信息进行解析处理,根据解析处理结果更新所述已下载信息。
3.根据权利要求2所述的方法,其特征在于,在所述根据解析处理结果更新所述已下载信息之后,还包括:
基于预设剔除策略从所述内容信息中剔除掉无关信息,根据剔除结果更新所述内容信息,其中,所述无关信息包括广告信息和/或链接信息;和/或,
基于预设格式化策略对所述标题信息和/或所述内容信息进行格式化处理,根据格式化处理结果更新所述标题信息和/或所述内容信息。
4.根据权利要求1所述的方法,其特征在于,所述目录创建函数通过如下步骤实现目录创建功能:
若所述目标路径信息不是文件格式,则基于所述目标路径信息检测所述本地硬盘中是否存在与所述目标路径信息相应的所述文件目录;
若否,则创建出与所述目标路径信息相应的所述文件目录。
5.根据权利要求1所述的方法,其特征在于,所述信息存储函数通过如下步骤实现信息存储功能:
以所述内容信息为入参参数,调用已构建完成的格式转换函数,根据所述格式转换函数的输出结果更新所述内容信息;
若所述文件目录下未存在所述待存储文件,则在所述文件目录下生成所述待存储文件,并将所述已下载信息写入所述待存储文件中。
6.根据权利要求5所述的方法,其特征在于,所述信息存储函数是file_info=save_file(html2_markdown_text(content),title,user_name),其中,save_file是所述信息存储函数的函数名称,file_info是所述信息存储函数的出参参数,file_info是所述文件目录,html2_markdown_text(content),title,user_name是所述信息存储函数的入参参数,title是所述标题信息,user_name是所述作者信息,html2_markdown_text是所述格式转换函数的函数名称,content是所述格式转换函数的入参参数,content是所述内容信息;
html2_markdown_text(content)通过如下步骤实现格式转换功能:
调用h=html2text.HTML2Text()构建出html2text的读写变量h,其中,html2text是由网页格式转换为纯文本格式;
调用h.protect_links=True将所述网页格式的content中的图片链接保留在所述纯文本格式的content中,其中,protect_links是链接保留参数;
调用h.body_width=0控制所述纯文本格式的content不进行自动换行,其中,body_width是文本宽度参数;
调用return h.handle(content)输出所述纯文本格式的content。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼鱼乐网络科技有限公司,未经武汉斗鱼鱼乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010610857.0/1.html,转载请声明来源钻瓜专利网。