[发明专利]一种基于文本点击率的搜索结果推荐方法及系统有效
申请号: | 202011386336.8 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112487274B | 公开(公告)日: | 2023-02-07 |
发明(设计)人: | 高萌;王进;胡峰;杨小姜;华尹;彭浩 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/9535;G06F16/33;G06F16/335;G06F16/35;G06N3/0464;G06N3/08 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 点击率 搜索 结果 推荐 方法 系统 | ||
本发明公开了一种基于文本点击率的搜索结果推荐方法及系统,属于机器学习、和自然语言处理领域,所述方法包括:对搜索文本query和title进行预处理操作;对文本query和title构建特征工程;利用改进DRCN构建的RRSCN深度匹配模型进行特征提取;利用RRSCN深度匹配模型构建预训练模型;根据特征工程和RRSCN深度匹配模型构建三输入的全连接层网络;本发明根据文本query和title预测query下文本点击率,通过构建特征工程,特征选择工作,构建三输入深度学习文本匹配模型,从而可以更精确的预测文本预估点击率和相关性,准确的给用户推荐最有可能点击的搜索结果,提高用户的体验性。
技术领域
本发明属于机器学习、深度学习、自然语言处理技术领域,具体涉及一种基于文本点击率的搜索结果推荐方法及系统。
背景技术
互联网的迅速发展带来了海量的信息数据,但是用户在海量数据中搜索自己想要的信息时无法准确快速的锁定自己想要获得的信息,使得用户对搜索数据信息的体验较差,而文本预估点击率和相关性匹配方法可以很好的解决这一问题。为了增强用户的搜索体验,使得用户可以快速准确的搜索到自己想要关注了解的信息,利用大量的历史搜索数据,通过分析不同用户的点击行为日志,给用户展示最可能被点击的文章标题,增强用户的体验,提高文章信息的点击率和转换率。
发明内容
针对上述现有技术的不足,本发明提出了一种基于文本点击率的搜索结果推荐方法及系统,通过改进的深度匹配模型利用预训练思想以及结合一些手工特征去获取搜索内容query和搜索结果title之间的关联,旨在准确有效地把用户最想要关注的文章展示给用户,可以提高文章信息产品的点击率,同时具有一定的实现意义。
根据本发明的一个方面,提供一种基于文本点击率的搜索结果推荐方法,所述方法包括:
步骤110,对搜索内容query和搜索结果title进行预处理操作;
步骤120,对query和title构建特征工程;所述特征工程包括:词粒度的统计特征,文本语义特征,相似度特征,历史信息特征;
步骤130,利用改进的深度紧密递归交互注意力机制的网络DRCN构建基于残差递归自注意力和交互注意力机制的网络RRSCN的深度匹配模型,来进行特征提取;
步骤140,根据步骤130得到的RRSCN深度匹配模型,通过流式读取方法训练全量数据加上微调迁移学习的方式获取RRSCN的预训练模型;
步骤150,根据特征工程和RRSCN深度匹配模型构建三输入的全连接层网络;
步骤160,利用构建的全连接层网络预测文本预估点击率和相关性,给用户推荐最优可能点击的搜索结果。
根据本发明的另一个方面,提供一种基于文本点击率的搜索结果推荐系统,包括用于存储海量可搜索标题title的文本服务器,以及用于用户输入搜索问题query和显示最优搜索结果的用户搜索界面,所述系统还包括以下模块:
文本预处理模块S110,用于分别从用户搜索界面和文本服务器获取搜索问题query和搜索标题title,对搜索问题query和搜索标题title进行预处理操作;
特征工程构建模块S120,用于对query和title构建特征工程;所述特征工程包括:词粒度的统计特征,文本语义特征,相似度特征,历史信息特征;
特征提取模块S130,用于利用改进的深度紧密递归交互注意力机制的网络DRCN构建基于残差递归自注意力和交互注意力机制的网络RRSCN的深度匹配模型,来进行特征提取;
预训练模型构建模块S140,用于根据特征提取模块S130得到的RRSCN深度匹配模型,通过流式读取方法训练全量数据加上微调迁移学习的方式获取RRSCN的预训练模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011386336.8/2.html,转载请声明来源钻瓜专利网。