[发明专利]基于多模式字符串的设备材料名称匹配方法在审
申请号: | 202110689643.1 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113312356A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 乔慧婷;文上勇;万正东;黄琰;余泽远 | 申请(专利权)人: | 南方电网能源发展研究院有限责任公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28;G06F16/903;G06F40/211;G06F40/242;G06F40/279;G06F40/30 |
代理公司: | 南昌新天下专利商标代理有限公司 36115 | 代理人: | 戴继翔 |
地址: | 511458 广东省广州市南沙区丰泽东路1*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模式 字符串 设备 材料 名称 匹配 方法 | ||
1. 基于多模式字符串的设备材料名称匹配方法,其特征在于,具体步骤如下:
步骤1)构建设备材料数据库
收集国网设备材料信息价、南网设备材料信息价、设计院提资设备数据并进行分类存储,构建设备材料数据库;
步骤2)构建重点语句库
根据电网工程造价词语逻辑规则,手动拆解设备材料名称,建立标准设备仓库;而后将国网设备材料信息价、南网设备材料信息价、设计院提资设备数据进行标准化处理,构建重点语句库,从而获得分词表,模拟人对句子的理解过程;
步骤3)搭建价格信息数据仓库
采用mysql数据库存储基础结构化数据,根据业务词语关系,构建表与表之间的主外键关联,具体是将设备材料数据库的数据和分词表,按照不同类别进行分类存储,以建立价格信息数据仓库;
步骤4)分析分词匹配
对价格信息数据仓库中的数据调用独立算法服务进行分词匹配,再输入工程文件中抽取的设备材料名称及信息价设备名称集合,而后将设备材料名称依次对信息价设备名称进行匹配,最终输出匹配度最高的名称进行关联;
步骤5)建立匹配算法库
整体设计设备材料匹配以建立匹配算法库,匹配算法库包括工程设备材料抽取、设备名称匹配分析、人工干预支持、设备匹配价格差异分析、设备匹配情况展示、设备匹配统计分析六个方面,确保设备材料名称准确匹配。
2.根据权利要求1所述的基于多模式字符串的设备材料名称匹配方法,其特征在于,步骤1)中,所述收集字段信息按类型存储。
3.根据权利要求1所述的基于多模式字符串的设备材料名称匹配方法,其特征在于,步骤1)中,所述国网设备材料信息价包括大类、中类、小类、设备材料名称、属性组合;南网设备材料信息价和设计院提资设备包括设备名称、规格型号。
4.根据权利要求1所述的基于多模式字符串的设备材料名称匹配方法,其特征在于,步骤2)中,所述重点语句库基于规则字典的分词方法进行句法、语义分析,利用句法信息和语义信息处理歧义现象。
5.根据权利要求4所述的基于多模式字符串的设备材料名称匹配方法,其特征在于,所述重点语句库包括三个部分:分词子系统、句法语义子系统、总控部分,在总控部分的协调下,分词子系统能够获得对应词、句子的句法和语义信息,以对分词歧义进行判断。
6. 根据权利要求1所述的基于多模式字符串的设备材料名称匹配方法,其特征在于,步骤4)中,所述匹配算法库采用UAP3.0平台,基于OSGI框架使用java进行开发,前端基于MXFramework3.0 + Echarts4.0.3 + JQuery + UEditor + VUE实现页面,遵循平台Weblet等开发规范,系统管理接入生产环境ISC,采用Hibernate和JDBC进行实现数据持久化操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网能源发展研究院有限责任公司,未经南方电网能源发展研究院有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110689643.1/1.html,转载请声明来源钻瓜专利网。