[发明专利]一种自动解析工程清单的方法及系统有效
申请号: | 201811195858.2 | 申请日: | 2018-10-15 |
公开(公告)号: | CN109408637B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 王哲钦 | 申请(专利权)人: | 苏州慧筑信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06Q10/10 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 胡拥军;糜婧 |
地址: | 200335 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 解析 工程 清单 方法 系统 | ||
1.一种自动解析工程清单的方法,其特征在于包括:
获取项目特征,获取包含项目特征的工程清单,其中所述项目特征为含有若干字符的文本;
关键词筛选,根据预设建筑装饰专业词库对所述项目特征进行分词处理以及语素标注处理,得到若干已标注词语,根据预先设置的筛选规则对所述已标注词语进行筛选得到至少一关键词;
建立工程清单学习模型,将历史工程清单数据作为训练数据输入学习模型中进行训练,得到工程清单学习模型,其中,所述历史工程清单数据包括若干拆分项、若干人工类型以及若干样本关键词,所述拆分项、所述人工类型以及所述样本关键词之间具有关联关系;
关键词分析,将所述关键词输入所述工程清单学习模型中,所述工程清单学习模型输出对应的所述拆分项以及所述人工类型;
每个所述样本关键词与至少一个所述拆分项具有关联关系,每个所述样本关键词与每个所述拆分项之间对应一个拆分项关联概率;
所述工程清单学习模型输出至少一个对应的所述拆分项,根据所述拆分项对应的所述拆分项关联概率对所述拆分项进行降序排列。
2.如权利要求1所述的一种自动解析工程清单的方法,其特征在于:所述根据预设建筑装饰专业词库对所述项目特征进行分词处理具体为:采用条件随机场模型框架并根据预设建筑装饰专业词库对所述项目特征进行分词处理,得到若干词语。
3.如权利要求2所述的一种自动解析工程清单的方法,其特征在于:所述语素标注处理具体为:对上所述词语添加词性标注,得到已标注词语。
4.如权利要求1所述的一种自动解析工程清单的方法,其特征在于:每个所述样本关键词与至少一个所述人工类型具有关联关系,每个所述样本关键词与每个所述人工类型之间对应一个人工类型关联概率。
5.如权利要求4所述的一种自动解析工程清单的方法,其特征在于:所述工程清单学习模型输出至少一个对应的所述人工类型,根据所述人工类型对应的所述人工类型关联概率对所述人工类型进行降序排列。
6.一种自动解析工程清单的系统,其特征在于包括:
获取项目特征模块,所述获取项目特征模块用于获取包含项目特征的工程清单,其中所述项目特征为含有若干字符的文本;
关键词筛选模块,所述关键词筛选模块用于根据预设建筑装饰专业词库对所述项目特征进行分词处理以及语素标注处理,得到若干已标注词语,根据预先设置的筛选规则对所述已标注词语进行筛选得到至少一关键词;
建立工程清单学习模型模块,所述建立工程清单学习模型模块用于将历史工程清单数据作为训练数据输入学习模型中进行训练,得到工程清单学习模型,其中,所述历史工程清单数据包括若干拆分项、若干人工类型以及若干样本关键词,所述拆分项、所述人工类型以及所述样本关键词之间具有关联关系;
关键词分析模块,所述关键词分析模块用于将所述关键词输入所述工程清单学习模型中,所述工程清单学习模型输出对应的所述拆分项以及所述人工类型;
每个所述样本关键词与至少一个所述拆分项具有关联关系,每个所述样本关键词与每个所述拆分项之间对应一个拆分项关联概率;
所述工程清单学习模型输出至少一个对应的所述拆分项,根据所述拆分项对应的所述拆分项关联概率对所述拆分项进行降序排列。
7.如权利要求6所述的一种自动解析工程清单的系统,其特征在于:所述关键词筛选模块包括分词处理单元、语素标注处理单元以及筛选单元,所述分词处理单元用于根据预设建筑装饰专业词库对所述项目特征进行分词处理,得到若干词语,所述语素标注处理用于对所述词语进行语素标注处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州慧筑信息科技有限公司,未经苏州慧筑信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811195858.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本分类方法及装置
- 下一篇:定标集更新方法及装置