[发明专利]一种基于用户行为特征及文章属性的保险文章推荐方法在审
申请号: | 202010306067.3 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111651584A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 杨喆;田立文;徐铮;裴晋 | 申请(专利权)人: | 世纪保众(北京)网络科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06Q40/08 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 姚金良 |
地址: | 102600 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 行为 特征 文章 属性 保险 推荐 方法 | ||
本发明提供了一种基于用户行为特征及文章属性的保险文章推荐方法,包括:第一步骤:执行用户属性及用户行为数据采集和过过滤;第二步骤:执行保险文章数据采集的采集和过滤;第三步骤:根据采集和过滤后的用户属性及用户行为数据和保险文章数据,执行用户特征抽取和文章特征抽取;第四步骤:确定推荐流程及推荐模型;第五步骤:执行模型设计及训练;第六步骤:输出模型结果。
技术领域
本发明涉及保险领域,具体涉及一种基于用户行为特征及文章属性的保险文章推荐方法。
背景技术
近年来大量用户已经开始习惯于在互联网/移动互联网上进行保险知识的学习,保障需求的咨询,了解保险产品,互联网上产生了大量的用户了解和学习保险知识、保险产品、健康知识的行为数据。
大数据处理、用户行为推荐等相关技术的发展,已经可以满足基于用户的各种互联网操作行为特征、用户属性和文章的特征属性,来进行用户潜在保险领域阅读需求的客观分析,并进行千人千面的保险相关文章的推荐。
目前,有些平台根据用户问卷调查、问题回答的结果,建立用户属性特征和需求标签,设计基于更新时间的、或者基于用户属性和需求标签的文章推荐规则逻辑,为用户推荐某一类的保险文章或者健康知识文章。
但是,现有方案未充分利用大数据技术进行用户需求的挖掘和模拟,或者对大数据技术、推荐技术的应用不够深入,对文章的自然语言处理没有基于保险领域的专题、主题、知识图谱等模型进行推荐算法设计,在保险领域的推荐模型泛化能力不强,推荐结果准确度不够,对用户需求的分析深度、细粒度和客观度不够,从而导致对保险相关文章的推荐不够专业、准确、全面。
还有些平台基于用户分类的简单推荐,例如先将用户简单标识为中年家庭支柱、重疾险的感兴趣用户、少儿险的感兴趣用户,属于简单权重变化、固定分类推荐规则进行保险相关文章或者健康相关文章的推荐。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供一种基于用户行为特征及文章属性的保险文章推荐方法,其中通过特定的技术方案和实现机制,达到根据用户的各种互联网操作行为特征、用户属性及保险相关文章的特征属性,为用户推荐其更喜欢看的、有个人学习和了解需求的保险相关文章。
根据本发明,提供了一种基于用户行为特征及文章属性的保险文章推荐方法,包括:
第一步骤:执行用户属性及用户行为数据采集和过过滤;
第二步骤:执行保险文章数据采集的采集和过滤;
第三步骤:根据采集和过滤后的用户属性及用户行为数据和保险文章数据,执行用户特征抽取和文章特征抽取;
第四步骤:确定推荐流程及推荐模型;
第五步骤:执行模型设计及训练;
第六步骤:输出模型结果。
优选地,用户属性及用户行为数据的采集包括:通过数据库数据获取用户操作日志数据,将用户操作日志数据建模所需的用户互联网操作行为数据存储到建模宽表。
优选地,用户属性及用户行为数据的过滤包括:针对用户操作日志数据,对无效数据、重复数据、失真、噪声数据进行删除处理。
优选地,保险文章数据采集的采集包括:将用户阅读过的历史保险文章进行采集以及数据结构化解析,并建立每篇文章与用户操作行为的关联。
优选地,保险文章数据采集的过滤包括:针对数据结构化解析的保险文章,对无效数据、重复数据、失真、噪声数据进行删除处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪保众(北京)网络科技有限公司,未经世纪保众(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010306067.3/2.html,转载请声明来源钻瓜专利网。