[发明专利]基于模糊匹配的政务数据梳理方法及装置有效
申请号: | 201710521720.6 | 申请日: | 2017-06-30 |
公开(公告)号: | CN108376140B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 廖昕;朱胜 | 申请(专利权)人: | 勤智数码科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 韩雪 |
地址: | 610000 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 匹配 政务 数据 梳理 方法 装置 | ||
1.基于模糊匹配的政务数据梳理方法,其特征在于包括:
对某一政务数据抽取关键词标签,建立标签模板;
对需要匹配的政务数据进行梳理后,抽取关键词标签;
其中,政务数据通过数据梳理系统进行梳理,具体的:
数据梳理系统对政务信息资源从业务层进行梳理,依次从部门、部门职责、职责相关的信息资源、信息资源相关的数据项逐层全面梳理;
数据梳理系统对政务信息资源从技术层进行梳理,依次从部门系统、部门系统数据库、数据库中包含的表、表包含的字段逐层全面梳理;
根据相似度计算方法计算需要匹配的政务数据的关键词标签与标签模板的标签的相似度;
计算出的相似度与阈值进行比较来判断上述某一政务数据是否与梳理后的政务数据相匹配。
2.根据权利要求1所述的基于模糊匹配的政务数据梳理方法,其特征在于政务数据指的是通过数据梳理系统梳理政务数据后,抽取符合该业务特点的标签。
3.根据权利要求1所述的基于模糊匹配的政务数据梳理方法,其特征在于标签模板是某一政务数据具有特点的标签集合。
4.根据权利要求1所述的基于模糊匹配的政务数据梳理方法,其特征在于阈值范围是70%及以上。
5.根据权利要求1所述的基于模糊匹配的政务数据梳理方法,其特征在于相似度计算方法指的是编辑距离算法、向量空间模型的余弦定理算法。
6.基于模糊匹配的政务数据梳理装置,其特征在于包括:
标签提取装置,用于对某一政务数据抽取关键词标签;同时对需要匹配的政务数据进行梳理后,抽取关键词标签;
其中,政务数据通过数据梳理系统进行梳理,具体的:
数据梳理系统对政务信息资源从业务层进行梳理,依次从部门、部门职责、职责相关的信息资源、信息资源相关的数据项逐层全面梳理;
数据梳理系统对政务信息资源从技术层进行梳理,依次从部门系统、部门系统数据库、数据库中包含的表、表包含的字段逐层全面梳理;
匹配标签判断模块,根据相似度计算方法计算这两个政务数据的相似度;计算出的相似度与阈值进行比较来判断上述某一政务数据是否与梳理后的政务数据相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于勤智数码科技股份有限公司,未经勤智数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710521720.6/1.html,转载请声明来源钻瓜专利网。