[发明专利]候选字符串的处理方法、装置、电子设备及存储介质有效
申请号: | 202010304901.5 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111665955B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 王鑫;李旭;孙明明;李平 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/232;G06N3/0455;G06N3/084;G06N3/044;G06N3/0442 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选 字符串 处理 方法 装置 电子设备 存储 介质 | ||
1.一种输入法中的候选字符串的处理方法,其特征在于,包括:
采集用户输入的坐标序列;所述坐标序列包括用户想要输入的字符串中各个字符在输入法的软键盘所在的坐标系中的坐标;且各所述字符的坐标按照被用户输入时点击的先后顺序排列;各所述字符的坐标为二维坐标;
基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串;
基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串,包括:将所述坐标序列输入至所述候选字符串预测模型中,所述候选字符串预测模型基于所述坐标序列,预测所述至少一个候选字符串;
基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串,包括:
采用所述候选字符串预测模型中的编码器,基于所述坐标序列进行编码处理,获取到所述坐标序列的特征表达;
采用所述候选字符串预测模型中的解码器,基于所述坐标序列的特征表达进行解码,获取所述至少一个候选字符串;
采用所述候选字符串预测模型中的编码器,基于所述坐标序列进行编码处理,获取到所述坐标序列的特征表达,包括:
采用所述编码器,对所述坐标序列中的各坐标进行映射表达,得到各所述坐标的特征表达;
采用所述编码器,基于各所述坐标的特征表达进行编码处理,获取到所述坐标序列的特征表达。
2.根据权利要求1所述的方法,其特征在于,采用所述编码器,对所述坐标序列中的各坐标进行映射表达,得到各所述坐标的特征表达之前,所述方法还包括:
对所述坐标序列中各坐标进行归一化处理,得到归一化后的所述坐标序列。
3.根据权利要求1所述的方法,其特征在于,采用所述候选字符串预测模型中的解码器,基于所述坐标序列的特征表达进行解码,获取所述至少一个候选字符串,包括:
采用所述解码器,以所述坐标序列的特征表达作为初始的隐含层状态进行解码,获取候选字符集合中各字符成为解码字符的解码概率;
从所述候选字符集合中搜索解码概率最大的N个字符;
对所述N个字符中各所述字符进行特征映射,得到相应的特征表达;
对于所述N个字符中各所述字符,采用所述字符的特征表达,更新隐含层状态;并基于更新后的所述隐含层状态,继续解码,再次获取所述候选字符集合中各所述字符成为解码字符的解码概率,并获取解码概率最大的N个字符,以此类推,直至解码到结束符或者解码得到的字符串长度达预设阈值,解码结束,获取得到所述至少一个候选字符串。
4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
基于所述坐标序列以及所述候选字符串预测模型,预测各所述候选字符串的概率;
按照概率由大到小的顺序,向所述用户推荐所述至少一个候选字符串。
5.一种权利要求1-4任一项所述的方法中使用的候选字符串预测模型的训练方法,其特征在于,所述方法包括:
采集数条训练数据;各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列;所述训练坐标序列包括用户想要输入的训练字符串中各个训练字符在输入法的软键盘所在的坐标系中的坐标;且各所述训练字符的坐标按照被用户输入时点击的先后顺序排列;各所述训练字符的坐标为二维坐标;
采用各条所述训练数据,对所述候选字符串预测模型进行训练;
采用各条所述训练数据,对所述候选字符串预测模型进行训练,包括:
对于各条所述训练数据,基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型,生成预测字符串的各预测字符的预测概率分布;
对于各条所述训练数据,基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型,生成预测字符串的各预测字符的预测概率分布,包括:
对于各条所述训练数据,采用所述候选字符串预测模型中的编码器,基于所述训练坐标序列进行编码处理,获取到所述训练坐标序列的特征表达;
对于各条所述训练数据,采用所述候选字符串预测模型中的解码器,基于所述训练坐标序列的特征表达进行解码,获取所述预测字符串的各预测字符的预测概率分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010304901.5/1.html,转载请声明来源钻瓜专利网。