[发明专利]一种基于输入法应用的新用户的冷启动方法及设备有效
申请号: | 201910860028.5 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110703924B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 陈文涛;郑小宾 | 申请(专利权)人: | 连尚(新昌)网络科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F9/445 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 312500 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 输入法 应用 新用户 冷启动 方法 设备 | ||
1.一种基于输入法应用的新用户的冷启动方法,其特征在于,所述方法包括:
获取输入法应用中的新用户对应的终端所安装的应用程序列表,所述应用程序列表包括至少一个应用程序;
根据应用程序列表与所述新用户的应用程序列表相同的所有其他用户对词汇的使用频次,确定所述新用户的初始推荐词库;
将所述新用户的应用程序列表和所述初始推荐词库输入至词汇召回模型,预测所述初始推荐词库中的每个初始推荐词汇的使用概率;
根据所述使用概率从所述初始推荐词库中确定出所述新用户在所述输入法应用中的冷启动词库。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
训练并确定所述词汇召回模型,其中,所述词汇召回模型用于预测所述输入法应用中的用户对词汇的使用概率。
3.根据权利要求2所述的方法,其特征在于,所述训练并确定所述词汇召回模型,其中,所述词汇召回模型用于预测所述输入法应用中的用户对词汇的使用概率,包括:
获取所述输入法应用中的、最热门的第一预设数量的词汇作为用于训练所述词汇召回模型的候选词汇;
获取所述输入法应用中的、所有使用用户对应的终端所安装的应用程序列表和使用词汇的历史数据;
根据所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据,确定用于训练所述词汇召回模型的正样本和负样本;
对所述正样本和所述负样本进行训练,确定用于预测所述输入法应用中的用户对词汇的使用概率的所述词汇召回模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据,确定用于训练所述词汇召回模型的正样本和负样本,包括:
将所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据处理为用户、应用程序列表、候选词汇及是否使用所述候选词汇的四维数组;
将使用过所述候选词汇的使用用户对应的应用程序列表和候选词汇作为所述正样本,同时将未使用所述候选词汇的使用用户对应的应用程序列表和候选词汇作为所述负样本。
5.根据权利要求4所述的方法,其特征在于,所述将所述第一预设数量的候选词汇、所有所述使用用户的应用程序列表和使用词汇的所述历史数据处理为用户、应用程序列表、候选词汇及是否使用所述候选词汇的四维数组,包括:
从所述第一预设数量的候选词汇中任选一词汇作为目标候选词汇,重复如下操作直至遍历完所述第一预设数量的候选词汇,以得到用户、应用程序列表、候选词汇及是否使用所述候选词汇的四维数组:
根据使用词汇的所述历史数据,分别判断所有所述使用用户中各用户是否使用所述目标候选词汇,
若是,则得到使用所述目标候选词汇的使用用户、使用所述目标候选词汇的使用用户的应用程序列表、所述目标候选词汇及使用所述目标候选词汇的四维数组;
若否,则得到未使用所述目标候选词汇的使用用户、未使用所述目标候选词汇的使用用户的应用程序列表、所述目标候选词汇及未使用所述目标候选词汇的四维数组。
6.根据权利要求5所述的方法,其特征在于,所述对所述正样本和所述负样本进行训练,确定用于预测所述输入法应用中的用户对词汇的使用概率的词汇召回模型,包括:
通过排序学习算法和损失函数对所述正样本和所述负样本进行学习和训练,确定用于预测所述输入法应用中的用户对词汇的使用概率的词汇召回模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于连尚(新昌)网络科技有限公司,未经连尚(新昌)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860028.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于腕部或手部皮肤三维形状变化的指令输出方法及设备
- 下一篇:鼠标