[发明专利]工法推荐方法、装置、设备及存储介质有效
申请号: | 202110711860.6 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113434760B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 杨婉琪 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/30 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 方法 装置 设备 存储 介质 | ||
1.一种工法推荐方法,其特征在于,所述工法推荐方法包括:
获取工法书本中的标准文件,并利用预设的图像分割模型对所述标准文件中的每页内容进行分割,得到文本图像块集,其中,所述图像分割模型在进行训练时,根据输入的图片数据的数量,确定预设损失函数的权重系数,第一权重系数a1=(Ni/Nj)0.5;第二权重系数a2=(Nj/Ni)0.5,并根据预设的损失函数L=-label×log(predict)-α2×(1-label)×log(1-predict)确定损失值,根据损失值调整该图像分割模型的模型参数,得到最终的图像分割模型,其中,Ni为负样本类别的图像数据的数量,Nj为正样本类别的图像数据的数量,label为人工标注的训练样本的标注类别,predict为该图像分割模型输出的预测类别;
利用自然语言算法和预设的工法名称抽取模型分别对所述文本图像块集进行识别抽取,得到所述文本图像块集中各个文件的工法名称;
将所述文本图像块集中的各个文件按照所述工法名称进行分类,得到与每个工法名称对应的工法内容子集,并存储至工法内容数据库,其中,所述工法内容子集包括至少一个工法表格、至少一个工法图片和至少一个工法文本;
获取待分析的项目文件文本,提取所述项目文件文本中的工程名称信息,并基于所述工程名称信息,生成工程名称集;
根据所述工程名称集,确定工程名称集中的每个工程名称与工法内容子集中的工程信息对应关系,并计算所述工法内容子集中的工程信息与所述工程名称集中工程名称信息的适用度,基于所述适用度确定所述项目文件文本的工法书本的最优推荐工法;
根据所述工程名称集,从历史项目工程数据库中查询与工程名称集中每个工程名称信息相匹配的历史项目数据;
利用预设的项目建设分析模型,分析所述历史项目数据中对于项目的建造完整度,并基于所述建造完整度,确定所述项目文件文本的历史项目的最优推荐工法;
将所述工法书本匹配的推荐工法与所述历史项目的最优推荐工法作为所述待分析项目文件的建造工法进行输出。
2.根据权利要求1所述的工法推荐方法,其特征在于,所述获取工法书本中的标准文件,并利用预设的图像分割模型对所述标准文件中的每页内容进行分割,得到文本图像块集包括:
利用文件识别技术,识别工法书本中的标准文件,并调用预设的扫描程序对所述标准文件进行扫描,输出所述标准文件的图片数据;
利用图像分割模型,对所述图片数据进行结构化处理,得到结构化文件;
利用图像分割模型,识别所述结构化文件中的标注信息,并基于所述标注信息,对所述图片数据进行裁剪,得到工法表格、工法图片和工法文本;
对所述工法表格、工法图片和工法文本进行合并,得到文本图像块集。
3.根据权利要求2所述的工法推荐方法,其特征在于,所述利用图像分割模型,对所述图片数据进行结构化处理,得到结构化文件包括:
利用图像分割模型,识别所述图片数据中的表格内容、图像内容和文本内容;
记录所述表格内容、图像内容和文本内容在所述图片数据中的位置信息;
根据所述位置信息对所述表格内容、图像内容和文本内容标注,得到结构化文件。
4.根据权利要求1-3中任一项所述的工法推荐方法,其特征在于,所述利用自然语言算法和预设的工法名称抽取模型分别对所述文本图像块集进行识别抽取,得到所述文本图像块集中各个文件的工法名称包括:
利用自然语言算法识别所述文本图像块集中工法字段信息;
根据预设的工法名识别模型对所述工法字段信息进行工法词语抽取,得到所述文本图像块集中各个文件的工法名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110711860.6/1.html,转载请声明来源钻瓜专利网。