[发明专利]长文本预测方法、装置、设备和存储介质有效
申请号: | 201910499897.X | 申请日: | 2019-06-10 |
公开(公告)号: | CN110187780B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 蔡泽华;王轶翔 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/289;G06F40/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曹娜 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 预测 方法 装置 设备 存储 介质 | ||
1.一种长文本预测方法,其特征在于,包括:
接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;
利用所述上下文信息和长文本预测模型进行预测,得到与所述上下文信息的语义关联的至少一个长文本,所述长文本中包括多个词语;
向所述客户端发送至少一个所述长文本;
所述利用所述上下文信息和长文本预测模型进行预测,包括:
利用所述上下文信息确定模型输入特征;
将所述模型输入特征输入长文本预测模型进行预测;
所述上下文信息包括所述客户端的输入文本,所述客户端的输入文本包括如下至少一项:所述客户端的输入框中的前序文本、输入法的输入区中的当前输入码;所述利用所述上下文信息确定模型输入特征,包括以下至少一种:
在所述输入文本包括所述客户端的输入框中的前序文本的情况下,利用所述前序文本得到所述模型输入特征;
在所述输入文本包括输入法的输入区中的当前输入码的情况下,利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征;
在所述输入文本包括所述前序文本和所述当前输入码的情况下,将所述当前输入码获得翻译文本与所述前序文本拼接得到拼接文本,利用所述拼接文本得到所述模型输入特征。
2.根据权利要求1所述的方法,其特征在于,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。
3.根据权利要求1或2所述的方法,其特征在于,所述向所述客户端发送至少一个所述长文本,包括:
对至少一个所述长文本进行过滤,向所述客户端发送过滤后的内容。
4.一种长文本预测方法,其特征在于,包括:
获取客户端的上下文信息;
向服务器发送长文本预测请求,所述长文本预测请求中包括所述上下文信息,所述上下文信息包括所述客户端的输入文本,所述客户端的输入文本包括如下至少一项:所述客户端的输入框中的前序文本、输入法的输入区中的当前输入码;
接收来自所述服务器的与所述上下文信息的语义关联的至少一个长文本,所述长文本是所述服务器利用所述上下文信息和长文本预测模型预测得到的;
其中,在所述输入文本包括所述客户端的输入框中的前序文本的情况下,利用所述前序文本得到模型输入特征;
在所述输入文本包括输入法的输入区中的当前输入码的情况下,利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征;
在所述输入文本包括所述前序文本和所述当前输入码的情况下,将所述当前输入码获得翻译文本与所述前序文本拼接得到拼接文本,利用所述拼接文本得到所述模型输入特征;
所述模型输入特征用于输入所述长文本预测模型进行预测。
5.根据权利要求4所述的方法,其特征在于,所述上下文信息包括所述客户端的输入文本;所述获取客户端的上下文信息,包括:
获取所述客户端的输入框中的前序文本;和/或,
获取所述客户端使用的输入法的输入区中的当前输入码。
6.根据权利要求4或5所述的方法,其特征在于,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910499897.X/1.html,转载请声明来源钻瓜专利网。