[发明专利]候选词生成方法及装置在审
申请号: | 201810948159.4 | 申请日: | 2018-08-20 |
公开(公告)号: | CN110858099A | 公开(公告)日: | 2020-03-03 |
发明(设计)人: | 姚波怀;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/211;G06F40/289;G06K9/62 |
代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 赵景平 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选 生成 方法 装置 | ||
本发明公开了一种候选词生成方法及装置,所述方法包括:实时获取上文并得到候选词;根据所述上文确定用户情绪类别;根据所述用户情绪类别对所述候选词进行筛选,得到待输出的候选词。利用本发明,可以提高候选词的准确性,提升用户输入体验。
技术领域
本发明涉及输入法领域,具体涉及一种候选词生成方法及装置。
背景技术
输入法是一种将各种符号输入电子设备的编码方法,是人类和电子设备打交道不可或缺的工具。为了加快输入速度,现有的输入法大都具有联想记忆功能,即在输入一个汉字或一个词语后,输入法会自动推荐候选的字或词语。
现有的一些输入法,在用户输入过程中会进行词预测,预测用户下一个将要输入的词并提供给用户,以方便用户输入。目前输入法用于词预测的方法主要是利用大规模语料数据,使用传统的ngram统计模型,或者深度学习模型,学习出语言模型,然后利用这些模型,根据上文和输入环境等信息,找到最大概率的下文词。
这种方法虽然在一定程度上方便了用户输入,但目前的模型难以感知过长的上文,因此常常会出现断章取义的预测结果。例如,用户输入“色香味俱全,你做的菜”,目前输入法大都只会根据上文“你做的菜”,给出“不好吃”、“好吃”等候选词,很明显“不好吃”在这里并不是一个合理的候选词,这样的候选词不仅掩盖了其他表达赞赏情绪的候选词,比如,很赞、很棒等,而且给用户带来很差的体验。
发明内容
本发明实施例提供一种候选词生成方法及装置,以提高候选词的准确性,提升用户输入体验。
为此,本发明提供如下技术方案:
一种候选词生成方法,所述方法包括:
实时获取上文并得到候选词;
根据所述上文确定用户情绪类别;
根据所述用户情绪类别对所述候选词进行筛选,得到待输出的候选词。
优选地,所述上文为以下任意一种:文本、语音、图片。
优选地,所述方法还包括:预先构建情绪识别模型;
所述根据所述上文确定用户情绪类别包括:
提取所述上文的文本信息;
利用所述文本信息及所述情绪识别模型,得到用户情绪类别。
优选地,所述情绪识别模型为深度学习模型;所述提取所述上文的文本信息包括:获取所述上文对应的词序列,确定所述词序列中各词的词向量;或者
所述情绪识别模型为SVM或决策树;所述提取所述上文的文本信息包括:获取所述上文对应的词序列,确定所述词序列中各词的ID。
优选地,所述根据所述上文确定用户情绪类别还包括:
获取辅助信息,所述辅助信息包括以下任意一种或多种:当前环境信息、位置信息、用户身体信息;
利用所述文本信息、所述辅助信息及所述情绪识别模型,得到用户情绪类别。
优选地,所述方法还包括:
获取各候选词的候选得分;
所述根据所述用户情绪类别对所述候选词进行筛选,得到待输出的候选词包括:
根据所述用户情绪类别调整所述候选词的候选得分,得到所述候选词的最终得分;
根据所述最终得分确定待输出的候选词。
优选地,所述根据所述用户情绪类别调整所述候选词的候选得分,得到所述候选词的最终得分包括:
根据所述用户情绪类别确定各候选词的情感得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810948159.4/2.html,转载请声明来源钻瓜专利网。