[发明专利]表情推荐模型的训练、表情推荐方法、装置、设备及介质有效
申请号: | 201810695138.6 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109034203B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 王硕寰;孙宇;于佃海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289;G06F40/30;G06F3/023 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表情 推荐 模型 训练 方法 装置 设备 介质 | ||
本发明实施例公开了一种表情推荐模型的训练、表情推荐方法、装置、设备及介质。所述表情推荐模型的训练方法包括:根据至少两个用户的历史输入日志,构造表情推荐训练样本,所述表情推荐训练样本包括:文本信息,以及与所述文本信息对应的表情;使用所述表情推荐训练样本对设定机器学习模型进行训练,得到所述表情推荐模型。通过本发明实施例的技术方案,能够提高表情推荐模型的表情搜索效率以及使用泛化性。
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种表情推荐模型的训练、表情推荐方法、装置、设备及介质。
背景技术
随着互联网技术的发展,越来越多的用户使用聊天软件或微博等进行交流。在进行文字交流的过程中,经常需要使用表情图像来进行表达,以使表达内容更加生动形象。
目前的主流聊天软件(类似于微信,QQ,百度Hi等),微型博客与兴趣社区(类似于百度贴吧,豆瓣,微博,Twitter)等会内置很多表情提供用户使用。但是由于内置的表情非常多,有的软件中甚至有多达上千个表情,使得用户在实际使用时很难检索,大量的内置表情没有人使用。
针对这一问题,有些软件中使用的表情推荐模型是根据表情的来源与风格来进行构建的,具体为对其内置的表情进行分页存储,使得用户在使用过程中,需先选择表情的来源与风格,再选择具体表情;还有些软件或者社区中使用的表情推荐模型是利用对每个表情标注上特定的关键词来进行构建的,使得只有当用户键入了与表情名称一致的关键词时,才能把表情推荐给用户。
现有技术的缺陷在于:第一种表情推荐模型,其分页存储的是同一种风格的表情,导致用户在使用的过程中,仍然需要查看每一个分页,寻找到合适的表情,模型搜索效率低下;第二种表情推荐模型,没有泛化性,例如标注的关键词为“谢谢”的表情,只有当用户输入的文本为“谢谢”时才会触发该表情推荐,且只推荐这一个关键词对应的表情,当用户输入的文本为“感谢”或者“thanks”等,则无法推荐相关的表情。
发明内容
本发明实施例提供了一种表情推荐模型的训练、表情推荐方法、装置、设备及介质,以实现提高表情推荐模型的表情搜索效率以及使用泛化性。
第一方面,本发明实施例提供了一种表情推荐模型的训练方法,包括:
根据至少两个用户的历史输入日志,构造表情推荐训练样本,所述表情推荐训练样本包括:文本信息,以及与所述文本信息对应的表情;
使用所述表情推荐训练样本对设定机器学习模型进行训练,得到所述表情推荐模型。
第二方面,本发明实施例还提供了一种表情推荐方法,该方法包括:
获取用户输入的文本信息;
将所述文本信息与至少两个备选表情分别输入至预先训练的表情推荐模型中,所述表情推荐模型的输入为文本以及表情,所述表情推荐模型的输出为所述文本与所述表情是否关联的结果;
根据所述表情推荐模型针对各所述备选表情的输出结果,在所述备选表情中确定出与所述文本信息对应的关联表情提供给所述用户。
第三方面,本发明实施例还提供了一种表情推荐模型的训练装置,包括:
样本构造模块,用于根据至少两个用户的历史输入日志,构造表情推荐训练样本,所述表情推荐训练样本包括:文本信息,以及与所述文本信息对应的表情;
模型训练模块,用于使用所述表情推荐训练样本对设定机器学习模型进行训练,得到所述表情推荐模型。
第四方面,本发明实施例还提供了一种表情推荐装置,该装置包括:
信息获取模块,用于获取用户输入的文本信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810695138.6/2.html,转载请声明来源钻瓜专利网。