[发明专利]表情推荐模型的训练、表情推荐方法、装置、设备及介质有效
申请号: | 201810695138.6 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109034203B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 王硕寰;孙宇;于佃海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289;G06F40/30;G06F3/023 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表情 推荐 模型 训练 方法 装置 设备 介质 | ||
1.一种表情推荐模型的训练方法,其特征在于,包括:
根据至少两个用户的历史输入日志,构造表情推荐训练样本,所述表情推荐训练样本包括:文本信息,以及与所述文本信息对应的表情;
使用所述表情推荐训练样本对设定机器学习模型进行训练,得到所述表情推荐模型;
其中,所述设定机器学习模型包括:文本端子模型、表情端子模型、分别与所述文本端子模型和所述表情端子模型相连的第一全连接层,以及与所述第一全连接层相连的二分类层;所述表情推荐模型的输出为所述文本与所述表情是否关联的结果。
2.根据权利要求1所述的方法,其特征在于,根据至少两个用户的历史输入日志,构造表情推荐训练样本,包括:
在所述历史输入日志中,获取包括表情的日志作为参考日志;
根据所述参考日志中包括的文本信息以及表情,构造所述表情推荐训练样本中的正例样本;
根据所述参考日志中包括的文本信息,以及除去所述参考日志中包括的表情之外的其他表情,构造所述表情推荐训练样本中的负例样本。
3.根据权利要求2所述的方法,其特征在于,在所述历史输入日志中,获取包括表情的日志作为参考日志之前,还包括:
如果确定所述历史输入日志中包括文本长度小于设定阈值的待合并日志,则获取与所述待合并日志对应的第一目标用户;
获取与所述第一目标用户对应的第一参考合并日志,所述第一参考合并日志的第一生成时间与所述待合并日志的第二生成时间相邻,且所述第一生成时间位于所述第二生成时间之前;
如果所述第一生成时间与所述第二生成时间之间的时间差值满足设定时间阈值条件,则将所述第一参考合并日志与所述待合并日志进行合并,得到新的历史输入日志。
4.根据权利要求2所述的方法,其特征在于,在所述历史输入日志中,获取包括表情的日志作为参考日志之后,还包括:
如果确定在所述参考日志中,包括仅具有表情的空文本日志,则获取与所述空文本日志对应的第二目标用户;
获取与所述第二目标用户对应的第二参考合并日志,所述第二参考合并日志的第三生成时间与所述空文本日志的第四生成时间相邻,且所述第三生成时间位于所述第四生成时间之前;
如果所述第三生成时间与所述第四生成时间之间的时间差值满足设定时间阈值条件,且所述第二参考合并日志中包括文本信息,则将所述第二参考合并日志与所述空文本日志进行合并,得到新的参考日志。
5.根据权利要求2所述的方法,其特征在于,在所述历史输入日志中,获取包括表情的日志作为参考日志之后,还包括:
检测所述参考日志中的文本信息中是否包括预先标注的命名实体:若是,则将所述文本信息中检测出的命名实体使用实体标签进行替换。
6.根据权利要求2所述的方法,其特征在于,根据所述参考日志中包括的文本信息以及表情,构造所述表情推荐训练样本中的正例样本,包括:
如果所述参考日志中包括有至少两个表情,则分别使用各所述表情与所述参考日志中包括的文本信息,构造至少两个正例样本。
7.根据权利要求1-6任一项所述的方法,其特征在于:
所述文本端子模型,具体包括:至少一个词语语义层,与所述词语语义层相连的第一双向RNN层,与所述第一双向RNN层相连的第一池化层;
所述词语语义层,具体包括:第二双向RNN层,与所述第二双向RNN层相连的第二池化层,以及与所述第二池化层相连的第一拼接层;
所述表情端子模型,具体包括:第三双向RNN层,与所述第三双向RNN层相连的第三池化层,以及与所述第三池化层相连的第二拼接层;
所述词语语义层,用于将输入的文本信息中分词的词特征输入至所述第一拼接层,以及将所述分词中各个字的字特征输入至所述第二双向RNN层;
所述表情端子模型,用于将输入的表情标识、表情词语表示的词特征分别输入至所述第二拼接层,以及将所述表情词语表示的各个字特征输入至所述第三双向RNN层;
所述二分类层,用于输出所述文本信息与所述表情是否关联的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810695138.6/1.html,转载请声明来源钻瓜专利网。