[发明专利]基于模糊匹配的政务数据梳理方法及装置有效
申请号: | 201710521720.6 | 申请日: | 2017-06-30 |
公开(公告)号: | CN108376140B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 廖昕;朱胜 | 申请(专利权)人: | 勤智数码科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 韩雪 |
地址: | 610000 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 匹配 政务 数据 梳理 方法 装置 | ||
本发明涉及政务数据处理领域,尤其是涉及基于模糊匹配的政务数据梳理方法及装置。本发明针对现有技术存在的问题,提供一种基于模糊匹配的政务数据梳理方法及装置。对某一的政务数据抽取关键词标签,建立标签模板;本发明对需要匹配的政务数据进行梳理后,抽取关键词标签;根据相似度计算方法计算需要匹配的政务数据的关键词标签与标签模板的标签的相似度;计算出的相似度与阈值进行比较来判断该业务数据是否与梳理后的业务数据相匹配。
技术领域
本发明涉及政务数据处理领域,尤其是涉及基于模糊匹配的政务数据梳理方法及装置。
背景技术
政府部门在业务开展过程中,产生若干数据资源。为了提高政府服务能力,需要其他部门提供相关数据支持。政府部门之间客观存在供需关系。在政务信息资源梳理过程中,政府部门对有些可以提高业务能力的数据的来源并不清楚。同时,政府部门对自身数据有哪些能支撑其他部门提高业务能力也并不清楚。
发明内容
本发明所要解决的技术问题是:针对上述存在的问题,提供一种基于模糊匹配的政务数据梳理方法及装置。
本发明采用的技术方案如下:
基于模糊匹配的政务数据梳理方法包括:
对某一政务数据抽取关键词标签,建立标签模板;
对需要匹配的政务数据进行梳理后,抽取关键词标签;
根据相似度计算方法计算需要匹配的政务数据的关键词标签与标签模板的标签的相似度;计算出的相似度与阈值进行比较来判断上述某一政务数据是否与梳理后的政务数据相匹配。
进一步的,政务数据指的是政务数据中业务层、信息资源、数据项中抽取符合该业务特点的标签。
进一步的,阈值范围是70%及以上。
进一步的,相似度计算方法是编辑距离算法、向量空间模型的余弦定理算法。
基于模糊匹配的政务数据梳理装置包括:
标签提取装置,用于对某一政务数据抽取关键词标签;同时对需要匹配的政务数据进行梳理后,抽取关键词标签;
匹配标签判断模块,根据相似度计算方法计算这两个政务数据的相似度;计算出的相似度与阈值进行比较来判断上述某一政务数据是否与梳理后的政务数据相匹配。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
根据本发明的匹配结果为用户提供匹配数据是否为有用数据提供依据。
通过抽取标签,并通过模糊匹配方法对标签进行匹配,让政府部门对自身数据有个更加清楚的了解。为后续做决策或者数据处理做准备。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
1、相关介绍:
基于模糊匹配的政务数据梳理方法是基于数据信息资源共享系统的;而数据信息资源共享系统包括数据梳理系统、服务封装系统、门户子系统。数据信息资源共享系统架构设计为:从整体的信息流通框架出发,按照分块实施、互通互联、资源共享、不同侧重的原则设计信息化的平台架构,以支撑各场景组成架构的各级业务。
数据梳理系统用于对获取的信息资源的关系从业务层和技术层分别进行梳理分析,根据应用场景自动或手动生成各级业务关系和各级数据信息关系,并建立信息资源、业务关系、数据信息三者之间的关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于勤智数码科技股份有限公司,未经勤智数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710521720.6/2.html,转载请声明来源钻瓜专利网。