[发明专利]一种基于信息资源库的政务用户画像构建方法及其系统在审

专利信息
申请号: 202010503176.4 申请日: 2020-06-03
公开(公告)号: CN111723256A 公开(公告)日: 2020-09-29
发明(设计)人: 汪敏;严妍;王静;刘轩山;周键 申请(专利权)人: 开普云信息科技股份有限公司;北京开普云信息科技有限公司
主分类号: G06F16/906 分类号: G06F16/906;G06F16/953;G06F16/901;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 523000 广东省东莞市石龙镇中*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信息 资源库 政务 用户 画像 构建 方法 及其 系统
【说明书】:

发明提供一种基于信息资源库的政务用户画像构建方法及其系统,所述方法包括:系统汇聚原始资源,根据存储介质构建多源计算模型;为资源自动匹配相应压缩算法并切片,根据网络环境自适应调整切片大小,运用数字指纹算法为每个切片生成数字指纹,经比对将有效切片与多源计算模型进行匹配,统一编码、自动寻址后存储;分析存储的数字指纹特征,智能抽取特征输出特定标签,运用聚类算法自动关联特定标签,构建用户分析模型,开展机器训练和加权计算,根据权重生成用户画像;运用推荐算法对用户画像打分实现精准推送,本技术通过对用户政务数据的智能分析梳理,构建法人/自然人用户画像,为实现政府网站的千人千网、专人专网的精准推送奠定基础。

技术领域

本发明属于数据处理、可视化技术领域,尤其涉及一种基于信息资源库的政务用户画像构建方法及其系统。

背景技术

在互联网大数据时代,网络信息高度冗杂,尤其是在各类事务相互交叉关联、重复使用度高的政府领域,更需要对数据有极高的专业处理能力,对政务数据进行全面的挖掘和分析,实现信息的精准采集和推送,降低不断重复提交的政务手续,实现政府网站千人千网、专人专网的精准定位。

目前,现有的画像构建方法是采集用户行为数据,去除冗余数据,对清洗后数据进行分析处理和特征提取,形成用户标签并生成用户画像,以实现精准营销。但是,这种技术方案也存在不足,其只能解决传统领域中数据规模不大、容易采集和存储的资源,而对于政府领域,由于横向跨部门、纵向分级的管理结构,各部门、各层级系统间的数据多是相互独立的,并且存储形式分散无序,无法实现完整采集,统一有序的管理,进而对用户特征无法全面提取和有效描述,也就无法进行精准推送,这个是当前急需解决的问题。

发明内容

为了解决现有技术对政务数据采集不完整导致画像描述不准确无法实现精确推送的问题,本发明提供一种基于信息资源库的政务用户画像构建方法及其系统,通过构建分类科学、集中规范、共享共用的信息资源库,按照“先入库,后使用”原则,对来自平台上各政府网站的信息资源以及对接应用系统数据库中的资源进行统一管理,实现统一采集、统一分类、统一元数据、统一数据格式、统一调用、统一监管,并运用压缩算法优化采集性能,通过模板自动切片智能提取特征标签,运用聚类算法自动关联标签构建用户分析模型,进而生成用户画像,最后将业务数据与用户画像相匹配,实现精准推荐,为实现政府网站的千人千网、专人专网的精准推送奠定基础。

本发明提供的一种基于信息资源库的政务用户画像构建方法,具体实现步骤是:

系统汇聚原始资源,判断不同存储介质特性,构建多源计算模型;判断原始资源数据类型、大小和使用频率,自动匹配合适的压缩算法并切片;动态收集网络速度、网络质量、后台服务器处理任务量级和处理能力等参数,自适应调整传输切片大小;运用数字指纹算法为每个切片生成一个数字指纹,比对数字指纹后将有效切片与多源计算模型进行匹配,统一编码、自动寻址存储到无限数据列表中;分析列表中的数字指纹特征,智能抽取特征输出特定标签;运用聚类算法自动关联特定标签,构建用户分析模型并进行机器训练和加权计算,根据权重生成用户画像;运用推荐算法对用户画像进行评分,根据得分实现多终端精准推送。

进一步地,原始资源来源可包括:区县信息资源库、数据库、文件系统、视频库、图片库、正风行风热线、政务信息公开、政务资料库等。

进一步地,多终端可以包括:网站发布系统、两微一端系统、政务服务门户、数据开发平台等。

进一步地,用户画像包括:法人用户画像、自然人用户画像。

进一步地,系统根据原始资源种类不同自动匹配合适的压缩算法,比如:图片优先使用RLE压缩算法,音视频优先使用Rice压缩算法,文本及其他类型使用deflate压缩算法,小文本优先选择snappy压缩算法。

进一步地,存储介质的种类包括:分布式文件系统、分布式缓存系统、非关系型数据库和关系型数据库等。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于开普云信息科技股份有限公司;北京开普云信息科技有限公司,未经开普云信息科技股份有限公司;北京开普云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010503176.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top