[发明专利]一种信息提取方法、装置、设备及存储介质在审
申请号: | 201911200747.0 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110941946A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 刘绮天 | 申请(专利权)人: | 西安四叶草信息技术有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F16/31 |
代理公司: | 西安泛想力专利代理事务所(普通合伙) 61260 | 代理人: | 石琳丹 |
地址: | 710000 陕西省西安市高新区鱼化*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 提取 方法 装置 设备 存储 介质 | ||
1.一种信息提取方法,其特征在于,包括:
采集原始文本数据;
根据所述原始文本数据,确定所述原始文本数据的属性;
根据所述原始文本数据的属性,格式处理所述原始文本数据,得到格式字符串;
泛化所述格式字符串,得到泛化数据;
解析所述泛化数据,得到解析数据;
提取所述解析数据。
2.根据权利要求1所述的信息提取方法,其特征在于:所述根据所述原始文本数据的属性,格式处理所述原始文本数据,得到格式字符串之前,还包括:根据格式需求,格式处理所述原始文本数据,得到相应的格式字符串。
3.根据权利要求2所述的信息提取方法,其特征在于:所述根据格式需求,格式处理所述原始文本数据,得到相应的格式字符串之后,泛化所述相应的格式字符串,得到相应的泛化数据。
4.根据权利要求1所述的信息提取方法,其特征在于:所述根据得到解析数据之前,还包括:根据数据提取需求,解析所述泛化数据。
5.一种信息提取装置,其特征在于,包括:
采集模块,用于采集原始文本数据;
确定模块,用于根据所述原始文本数据,确定所述原始文本数据的属性;
第一处理模块,用于根据所述原始文本数据的属性,格式处理所述原始文本数据,得到格式字符串;
第一泛化模块,用于泛化所述格式字符串,得到泛化数据;
第一解析模块,用于解析所述泛化数据,得到解析数据;
提取模块,用于提取所述解析数据。
6.根据权利要求5所述的信息提取装置,其特征在于:第一处理模块,还用于根据格式需求,格式处理所述原始文本数据,得到相应的格式字符串。
7.根据权利要求6所述的信息提取装置,其特征在于:第一泛化模块,还用于泛化所述相应的格式字符串,得到相应的泛化数据。
8.根据权利要求5所述的信息提取装置,其特征在于:第一解析模块,还用于根据数据提取需求,解析所述泛化数据。
9.一种提取设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机指令;所述处理器用于运行所述存储器存储的所述计算机指令实现权利要求1至4任一项所述的信息提取方法。
10.一种存储介质,其特征在于,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现权利要求1至4任一项所述的信息提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安四叶草信息技术有限公司,未经西安四叶草信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911200747.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置