[发明专利]基于用户问句生成标准问题的方法和装置有效
申请号: | 202010329631.3 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111221945B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 蒋亮;温祖杰;张家兴 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 问句 生成 标准 问题 方法 装置 | ||
本说明书实施例提供一种基于用户问句生成标准问题的方法和装置,方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。能够提高标准问题的生产效率,相应提升标准问题的覆盖率。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于用户问句生成标准问题的方法和装置。
背景技术
随着人工智能的发展,智能客服应运而生。智能客服即通过机器人客服与用户对话,解答用户问题。在智能客服中,通常预先确定一批提问方式很标准的问题,简称为标准问题,用于对用户提问进行匹配来识别用户真实意图。
现有技术中,通常通过人工挖掘的方式生产标准问题,例如,运营人员凭经验或者从线上用户问题中人工选择标准问题。这需要运营人员对业务有深入的了解,能够想象用户可能问到的各种问题。这对运营人员十分有难度,标准问题的生产效率低,也导致提升标准问题的覆盖率很困难。
因此,希望能有改进的方案,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。
发明内容
本说明书一个或多个实施例描述了一种基于用户问句生成标准问题的方法和装置,能够提高标准问题的生产效率,相应提升标准问题的覆盖率。
第一方面,提供了一种基于用户问句生成标准问题的方法,方法包括:
获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;
提取所述第一多轮对话中第一数目轮的用户问句;
对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;
将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。
在一种可能的实施方式中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:
判断所述第一数目是否小于或等于预设数目;
若所述第一数目小于或等于所述预设数目,则对所述第一数目轮的用户问句进行拼接处理,得到所述第一输入文本。
进一步地,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,还包括:
若所述第一数目大于所述预设数目,则将所述第一数目轮的用户问句按照顺序分为多组用户问句,每组用户问句包含的用户问句的数目不大于所述预设数目,且相邻的两组用户问句具有交集;
对所述各组用户问句分别进行拼接处理,得到各组用户问句分别对应的所述第一输入文本。
在一种可能的实施方式中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:
识别所述第一数目轮的用户问句中的闲聊语句;
删除所述第一数目轮的用户问句中的闲聊语句,得到第二数目轮的用户问句;
对所述第二数目轮的用户问句进行拼接处理,得到第一输入文本。
在一种可能的实施方式中,所述文本生成模型基于训练样本预先训练;
所述训练样本通过如下方式获取:
获取用户与机器人客服的第二多轮对话;
从所述第二多轮对话中提取用户问句和匹配成功的标准问题,以作为训练样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010329631.3/2.html,转载请声明来源钻瓜专利网。