[发明专利]一种基于信息资源库的政务用户画像构建方法及其系统在审
申请号: | 202010503176.4 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111723256A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 汪敏;严妍;王静;刘轩山;周键 | 申请(专利权)人: | 开普云信息科技股份有限公司;北京开普云信息科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/953;G06F16/901;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523000 广东省东莞市石龙镇中*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 资源库 政务 用户 画像 构建 方法 及其 系统 | ||
本发明提供一种基于信息资源库的政务用户画像构建方法及其系统,所述方法包括:系统汇聚原始资源,根据存储介质构建多源计算模型;为资源自动匹配相应压缩算法并切片,根据网络环境自适应调整切片大小,运用数字指纹算法为每个切片生成数字指纹,经比对将有效切片与多源计算模型进行匹配,统一编码、自动寻址后存储;分析存储的数字指纹特征,智能抽取特征输出特定标签,运用聚类算法自动关联特定标签,构建用户分析模型,开展机器训练和加权计算,根据权重生成用户画像;运用推荐算法对用户画像打分实现精准推送,本技术通过对用户政务数据的智能分析梳理,构建法人/自然人用户画像,为实现政府网站的千人千网、专人专网的精准推送奠定基础。
技术领域
本发明属于数据处理、可视化技术领域,尤其涉及一种基于信息资源库的政务用户画像构建方法及其系统。
背景技术
在互联网大数据时代,网络信息高度冗杂,尤其是在各类事务相互交叉关联、重复使用度高的政府领域,更需要对数据有极高的专业处理能力,对政务数据进行全面的挖掘和分析,实现信息的精准采集和推送,降低不断重复提交的政务手续,实现政府网站千人千网、专人专网的精准定位。
目前,现有的画像构建方法是采集用户行为数据,去除冗余数据,对清洗后数据进行分析处理和特征提取,形成用户标签并生成用户画像,以实现精准营销。但是,这种技术方案也存在不足,其只能解决传统领域中数据规模不大、容易采集和存储的资源,而对于政府领域,由于横向跨部门、纵向分级的管理结构,各部门、各层级系统间的数据多是相互独立的,并且存储形式分散无序,无法实现完整采集,统一有序的管理,进而对用户特征无法全面提取和有效描述,也就无法进行精准推送,这个是当前急需解决的问题。
发明内容
为了解决现有技术对政务数据采集不完整导致画像描述不准确无法实现精确推送的问题,本发明提供一种基于信息资源库的政务用户画像构建方法及其系统,通过构建分类科学、集中规范、共享共用的信息资源库,按照“先入库,后使用”原则,对来自平台上各政府网站的信息资源以及对接应用系统数据库中的资源进行统一管理,实现统一采集、统一分类、统一元数据、统一数据格式、统一调用、统一监管,并运用压缩算法优化采集性能,通过模板自动切片智能提取特征标签,运用聚类算法自动关联标签构建用户分析模型,进而生成用户画像,最后将业务数据与用户画像相匹配,实现精准推荐,为实现政府网站的千人千网、专人专网的精准推送奠定基础。
本发明提供的一种基于信息资源库的政务用户画像构建方法,具体实现步骤是:
系统汇聚原始资源,判断不同存储介质特性,构建多源计算模型;判断原始资源数据类型、大小和使用频率,自动匹配合适的压缩算法并切片;动态收集网络速度、网络质量、后台服务器处理任务量级和处理能力等参数,自适应调整传输切片大小;运用数字指纹算法为每个切片生成一个数字指纹,比对数字指纹后将有效切片与多源计算模型进行匹配,统一编码、自动寻址存储到无限数据列表中;分析列表中的数字指纹特征,智能抽取特征输出特定标签;运用聚类算法自动关联特定标签,构建用户分析模型并进行机器训练和加权计算,根据权重生成用户画像;运用推荐算法对用户画像进行评分,根据得分实现多终端精准推送。
进一步地,原始资源来源可包括:区县信息资源库、数据库、文件系统、视频库、图片库、正风行风热线、政务信息公开、政务资料库等。
进一步地,多终端可以包括:网站发布系统、两微一端系统、政务服务门户、数据开发平台等。
进一步地,用户画像包括:法人用户画像、自然人用户画像。
进一步地,系统根据原始资源种类不同自动匹配合适的压缩算法,比如:图片优先使用RLE压缩算法,音视频优先使用Rice压缩算法,文本及其他类型使用deflate压缩算法,小文本优先选择snappy压缩算法。
进一步地,存储介质的种类包括:分布式文件系统、分布式缓存系统、非关系型数据库和关系型数据库等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于开普云信息科技股份有限公司;北京开普云信息科技有限公司,未经开普云信息科技股份有限公司;北京开普云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010503176.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置