[发明专利]一种信息提取方法、装置、设备及存储介质在审
申请号: | 201911200747.0 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110941946A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 刘绮天 | 申请(专利权)人: | 西安四叶草信息技术有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F16/31 |
代理公司: | 西安泛想力专利代理事务所(普通合伙) 61260 | 代理人: | 石琳丹 |
地址: | 710000 陕西省西安市高新区鱼化*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 提取 方法 装置 设备 存储 介质 | ||
本发明提供一种信息提取方法,装置、设备及存储介质。包括采集原始文本数据;根据原始文本数据,确定原始文本数据的属性;根据原始文本数据的属性,格式处理原始文本数据,得到格式字符串;泛化格式字符串,得到泛化数据;解析泛化数据,得到解析数据,提取所述解析数据。与现有技术相比,该技术采集原始文本数据,并不立即对数据进行格式处理,而是确定原始文本数据的属性,根据原始文本数据的属性,选择灵活的格式方式,有目的性的对原始文本数据进行相应的格式处理,得到需要的泛化数据,进而得到所需的解析数据,从而提高了信息传输与同步的速率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种信息提取方法、装置、设备及存储介质。
背景技术
多个软件系统共同使用时,数据的同步和通信是一个经常遇到的问题,需要用合理、高效、安全的方式来进行数据的传输和解析。
目前,行业内对于数据的传输与解析数据多采用JSON格式,而如果使用 JSON格式进行传输,则仅可使用固定的格式进行传输和接收数据,对于接收方,必须定义同样的格式进行数据接收,这会导致双方系统需要耗费额外的精力用于处理数据的子级结构关系上,灵活性受到很大限制。
发明内容
本发明提供一种信息提取方法、装置、设备及存储介质。根据实际项目需求格式处理原始文本数据,解析出解析数据,在方式上处理更加灵活,从而提高了信息的传输效率。
第一方面,本申请实施例提供一种信息提取方法,包括:采集原始文本数据;根据所述原始文本数据,确定所述原始文本数据的属性;根据所述原始文本数据的属性,格式处理所述原始文本数据,得到格式字符串;泛化所述格式字符串,得到泛化数据;解析所述泛化数据,得到解析数据;提取所述解析数据。
该方法采集原始文本数据,并不立即对数据进行格式处理,而是首先确定原始文本数据的属性,根据原始文本数据的属性,选择灵活的格式方式,有目的性的对原始文本数据进行相应的格式处理,得到需要的泛化数据,进而得到所需的解析数据,从而提高了信息传输与同步的速率。
可选的,在得到格式字符串之前,还需根据格式需求,格式处理所述原始文本数据,得到相应的格式字符串。确定格式需求,直接得到所述格式需求的字符串,节省格式原始文本数据的时间,从而提高了传输信息的效率。
可选的,根据格式需求,格式处理所述原始文本数据,得到相应的格式字符串之后,泛化所述相应的格式字符串,得到相应的泛化数据。
可选的,根据得到解析数据之前,还需根据数据提取需求,解析泛化数据。
数据提取需求的设置,根据数据提取需求灵活的解析所述泛化数据,提取相应的解析数据,从而节省数据解析与提取的时间,进而提高了数据的传输效率。
下面提供一种信息提取装置、设备、存储介质及计算机程序产品,其效果可参考上述方法对应的效果,对此不再赘述。
第二方面,本申请实施例提供一种信息提取装置,包括:
采集模块,用于采集原始文本数据;
确定模块,用于根据所述原始文本数据,确定所述原始文本数据的属性;
第一处理模块,用于根据所述原始文本数据的属性,格式处理所述原始文本数据,得到格式字符串;
第一泛化模块,用于泛化所述格式字符串,得到泛化数据;
解析模块,用于解析所述泛化数据,得到解析数据;
第一提取模块,用于提取所述解析数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安四叶草信息技术有限公司,未经西安四叶草信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911200747.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置