[发明专利]基于政务数据的姓名特征识别系统在审
申请号: | 201910801931.4 | 申请日: | 2019-08-28 |
公开(公告)号: | CN110609928A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 华岗;王华飞;徐振 | 申请(专利权)人: | 宁波市智慧城市规划标准发展研究院;宁波中数云创信息技术有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/901 |
代理公司: | 11466 北京君恒知识产权代理事务所(普通合伙) | 代理人: | 黄启行 |
地址: | 315040 浙江省宁波市鄞州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于政务数据的姓名特征识别系统,包括以下几个步骤实现:A:判定和识别每列数据是否包含有属性描述;B:提取所述属性描述作为该列数据的标签,进行聚类测试,得出属性权值;提取该列数据中若干数据形成新的数据集,所述新的数据集中的字段进行字符提取并与现有姓氏表进行匹配,得出匹配率;C:得出属性预测率。与现有技术相比,本发明的有益效果是:本发明所述系统可获取政务数据集中的姓名属性描述,通过对姓名属性描述与自定义姓名模型的聚类测试和对随机提取政务数据集的部分数据与现有姓氏表的匹配,计算出属性预测率,本发明所述系统能够在海量且杂乱的政务数据中识别政务数据中的姓名特征,并将姓名提炼归纳,提高政务数据的处理效率。 | ||
搜索关键词: | 属性描述 列数据 匹配 数据集中 姓名特征 数据集 聚类 姓氏 测试 处理效率 识别系统 数据形成 随机提取 姓名模型 字符提取 自定义 预测 字段 判定 标签 提炼 归纳 | ||
【主权项】:
1.基于政务数据的姓名特征识别系统,其特征在于,包括以下几个步骤实现:/n步骤A:收集政务数据形成政务数据集,判定和识别所述政务数据集的每列数据是否包含有属性描述;/n步骤B:若所述政务数据集每列数据均包含属性描述,随机提取所述属性描述作为该列数据的标签,所述标签拆分成字符元组并与自定义姓名模型进行聚类测试,得出属性权值;提取该列数据中若干数据形成新的数据集,所述新的数据集中的字段进行字符提取并与现有姓氏表进行匹配,得出匹配率;/n若所述政务数据集每列数据集均未包含属性描述,则直接随机提取所述政务数据集各列数据中若干数据形成新的数据集,所述新的数据集中的字段进行字符提取并与现有姓氏表进行匹配,得出匹配率;/n步骤C:根据所述匹配率与所述属性权值以一定计算公式得出属性预测率。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波市智慧城市规划标准发展研究院;宁波中数云创信息技术有限公司,未经宁波市智慧城市规划标准发展研究院;宁波中数云创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910801931.4/,转载请声明来源钻瓜专利网。