[发明专利]自动整理航司退改规则的方法、系统、终端和存储介质在审
申请号: | 202110037555.3 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112733513A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 朱小武;吴芹;陈志刚;冯嵛;黄雪萍 | 申请(专利权)人: | 同程网络科技股份有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06F40/289 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 整理 航司退改 规则 方法 系统 终端 存储 介质 | ||
1.一种自动整理航司退改规则的方法,其特征在于,包括:
根据待处理文本,建立文本坐标系;
根据建立的文本坐标系,获取待处理文本中每个文字的文本坐标信息;
将所述待处理文本转换为图像文件,并得到图像处理结果;
根据所述图像处理结果,获取所述图像文件中的表格坐标信息,所述表格坐标信息包括每个表格的轮廓坐标信息以及单元格坐标信息;
根据所述表格坐标信息以及文本坐标信息,建立文本框架,每个文本框架内包括若干单元格及对应的子信息段;
根据预设的分配标记模型,为每个文本框架的单元格分配退改标签,所述退改标签包括主标签与子标签;
读取历史退改规则表格,所述历史退改规则表格中包括若干主标签与子标签;
根据退改标签,将所述子信息段填充入历史退改规则表格以获取当前退改规则表格;
将所述当前退改规则表格反馈至管理员终端。
2.根据权利要求1所述的自动整理航司退改规则的方法,其特征在于,每个所述子标签均对应有二级标签,所述二级标签内可包含多个同一类型不同条件的子标签,所述根据预设的分配标记模型,为每个文本框架内的单元格分配退改标签具体包括:
获取每个文本框架的标题信息,并根据标题信息为每个所述文本框架赋予一个主标签;
根据预设的分析模型,对所述文本框架中的子信息段进行条件标题筛选,并获取条件标题筛选结果;
根据所述条件标题筛选结果,获取退改条件单元格;
按照预设的分配原则,为每个所述退改条件单元格分配子标签;
根据退改条件单元格,获取退改信息单元格;
根据所述退改条件单元格,按照预设的纵向获取原则,获取纵向单元格;
将当前退改条件单元格对应的子标签赋予给所述纵向单元格;
按照预设的横向获取原则,获取横向单元格;
将当前退改条件单元格对应的子标签赋予给所述横向单元格。
3.根据权利要求1所述的自动整理航司退改规则的方法,其特征在于,所述表格坐标信息还包括页码信息,在根据所述图像处理结果,获取所述图像文件中的表格坐标信息之后,还包括:
根据所述页码信息,判断是否有两个在两面连续页码上的表格;
若判断为是,则根据轮廓坐标信息,判断所述两个在连续页码上的表格之间的最小纵坐标差值是否为预设的合并值;
若判断为是,则将所述两个在连续页码上的表格合并为一个新表格;
根据所述轮廓坐标信息,获取所述新表格的表格坐标信息。
4.根据权利要求2所述的自动整理航司退改规则的方法,其特征在于,在根据预设的分配标记模型,为每个文本框架内的单元格分配退改标签之后,还包括:
获取所有所述退改信息单元格;
判断是否有两个及以上的退改信息单元格携带的主标签及子标签完全相同;
若判断为是,则将携带主标签与子标签完全相同的单元格标记为异常单元格;
获取异常单元格对应的文本框架,并将获取的文本框架标记为异常文本框架;
判断所述异常文本框架中是否包含两个及以上的异常单元格;
若判断为是,则将所述异常文本框内的所有单元格对应的主标签及子标签清零。
5.根据权利要求4所述的自动整理航司退改规则的方法,其特征在于,在将所述异常文本框内的所有单元格对应的主标签及子标签清零之后,还包括:
对待处理文本进行文本分词处理,并得到分词处理结果,所述分词处理结果包括若干特征样本;
读取所述退改信息单元格对应的主标签与子标签,并将获取的主标签与子标签标记为待处理样本;
根据所述待处理样本与分词处理结果,获取与待处理样本的相似度超过预设阈值的特征样本,将获取的样本标记为比对样本;
获取比对样本的分布密度;
根据所述分布密度,确定特征区块;
获取所述特征区块的特征区块坐标信息;
获取当前退改信息单元格的单元格坐标信息;
根据所述特征区块坐标信息与所述当前退改信息单元格的坐标信息,判断所述退改信息单元格是否为异常单元格;
若判断为是,则将异常单元格的主标签及子标签清零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同程网络科技股份有限公司,未经同程网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110037555.3/1.html,转载请声明来源钻瓜专利网。