[发明专利]输入法中候选长句的提供方法、装置及电子设备有效
申请号: | 202011519631.6 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112506359B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 龚建 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F9/451 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入法 候选 长句 提供 方法 装置 电子设备 | ||
1.一种输入法中候选长句的提供方法,包括:
获取用户在输入法应用中输入的当前输入序列,以及所述用户的用户标识;
获取与所述当前输入序列相匹配的候选词语;
根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句;
在所述输入法应用上展示所述候选词语和所述候选长句;
所述预先训练的长句预测模型为,学习到用户标识、候选词语与后缀词语之间对应关系的模型;
所述根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句,包括:
获取所述用户标识对应的向量以及所述候选词语对应的向量;
结合预设的分隔符对所述用户标识对应的向量以及所述候选词语对应的向量进行拼接,得到第一拼接向量;
将所述第一拼接向量输入所述长句预测模型,获取所述长句预测模型输出的第一后缀词语;
根据所述候选词语以及所述第一后缀词语,生成所述候选长句;
在根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句之前,还包括:
获取第一训练数据,其中,所述第一训练数据包括:前缀样本词语、用户标识、与所述前缀样本词语和所述用户标识对应的后缀样本词语;
采用所述前缀样本词语、所述用户标识、以及所述后缀样本词语,对初始长句预测模型进行训练,得到所述预先训练的长句预测模型。
2.根据权利要求1所述的方法,其中,在根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句之前,还包括:
根据所述用户标识查询用户标识列表,判断所述用户标识列表中是否存在所述用户标识;
若所述用户标识列表中未存在所述用户标识,则根据预设用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句。
3.一种输入法中候选长句的提供方法,包括:
获取用户在输入法应用中输入的当前输入序列,以及所述用户的用户标识;
获取与所述当前输入序列相匹配的候选词语;
根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句;
在所述输入法应用上展示所述候选词语和所述候选长句;
所述预先训练的长句预测模型为,学习到用户标识、历史输入词语集合、候选词语与后缀词语之间对应关系的模型;
所述根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句,包括:
获取所述用户标识对应的向量以及所述候选词语对应的向量;
获取与所述用户标识对应的历史输入词语集合,以及所述历史输入词语集合对应的向量;
结合预设的分隔符对所述用户标识对应的向量、所述历史输入词语集合对应的向量以及所述候选词语对应的向量进行拼接,得到第二拼接向量;
将所述第二拼接向量输入所述长句预测模型,获取所述长句预测模型输出的第二后缀词语;
根据所述候选词语以及所述第二后缀词语,生成所述候选长句;
在根据所述用户标识、所述候选词语以及预先训练的长句预测模型,获取与所述用户标识以及所述候选词语匹配的候选长句之前,还包括:
获取第一训练数据,其中,所述第一训练数据包括:前缀样本词语、用户标识、与所述前缀样本词语和所述用户标识对应的后缀样本词语;
采用所述第一训练数据中的所述前缀样本词语、所述用户标识、以及所述后缀样本词语,对初始长句预测模型进行训练,得到训练之后的长句预测模型;
获取第二训练数据,其中,所述第二训练数据包括:前缀样本词语、用户标识、与所述用户标识对应的历史输入词语集合、与所述前缀样本词语、所述用户标识和所述历史输入词语集合对应的后缀样本词语;
采用所述第二训练数据中的所述前缀样本词语、所述用户标识、所述历史输入词语集合以及所述后缀样本词语,对所述训练之后的长句预测模型进行训练,得到所述预先训练的长句预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011519631.6/1.html,转载请声明来源钻瓜专利网。