[发明专利]基于深度学习模型构建智能聊天平台的方法及系统在审

专利信息
申请号: 202110094940.1 申请日: 2021-01-25
公开(公告)号: CN112784028A 公开(公告)日: 2021-05-11
发明(设计)人: 肖雪;荣广胜;李国涛 申请(专利权)人: 浪潮云信息技术股份公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/216;G06N3/04;G06N3/08
代理公司: 济南信达专利事务所有限公司 37100 代理人: 孙园园
地址: 250100 山东省济南市高*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 模型 构建 智能 聊天 平台 方法 系统
【说明书】:

发明公开了一种基于深度学习模型构建智能聊天平台的方法及系统,属于深度学习及大数据处理领域,本发明要解决的技术问题为如何提高模型预测输出语句的连贯性和积极性,提升用户体验,对外实现智能对话服务,采用的技术方案为:该方法具体如下:数据预处理:对从开源获取到的聊天语料数据进行数据预处理并训练词袋模型;构建并训练模型:构建深度学习模型seq2seq并对深度学习模型seq2seq进行训练,对训练后的深度学习模型seq2seq进行对话测试;对模型进行部署应用:根据训练后的深度学习模型seq2seq进行部署应用。该系统包括预处理单元、构建及训练单元和部署单元。

技术领域

本发明涉及深度学习及大数据处理领域,具体地说是一种基于深度学习模型构建智能聊天平台的方法及系统。

背景技术

目前对话机器人是一个热门话题,大家熟知的应用和产品主要有3种,具体如下:

①、虚拟助手:能对个人的输入完成相应的任务或提供相应服务的产品,如Siri、Cortana、度秘等;

②、智能音箱:通过语音交互,完成用户任务,也能对智能家具设备进行控制,典型的商业产品包括echo、天猫精灵、小爱同学;

③、闲聊对话:在开放领域与用户进行闲聊,典型商业产品如:微软小冰。

对话机器人的任务类型可以分为3类,具体如下:

第一类是任务型对话:主要解决如订机票、定酒店等问题,涉及的技术包括语义理解、意图识别、状态追踪、对话决策;

第二类是知识型对话:在寿险客服的场景里用户可能会问“你这个保险要交多少钱?”,这类问题,涉及的技术包括文本表示、语义匹配、知识图谱等;

第三类闲聊对话:用户可能只想找人聊聊天,对话不涉及到知识或业务,比如说“今天天气真好”,涉及到的技术包括文本生成模型、文本检索、排序技术等。

以解决闲聊型任务为例,大家较为熟悉的使用seq2seq生成闲聊机器人。但普通seq2seq可能出现负面情感的回复、疑问句式的回复、回复的多样性较低等问题,导致用户体验差,对话上下文不够连贯。因此负面情感回复、疑问句式回复、回复多样性低、一致性低,都是聊天机器人需要攻克的难点。

故如何提高模型预测输出语句的连贯性和积极性,提升用户体验,对外实现智能对话服务是目前亟待解决的问题,

发明内容

本发明的技术任务是提供一种基于深度学习模型构建智能聊天平台的方法及系统,来解决如何提高模型预测输出语句的连贯性和积极性,提升用户体验,对外实现智能对话服务的问题。

本发明的技术任务是按以下方式实现的,一种基于深度学习模型构建智能聊天平台的方法,该方法具体如下:

数据预处理:对从开源获取到的聊天语料数据进行数据预处理并训练词袋模型;

构建并训练模型:构建深度学习模型seq2seq并对深度学习模型seq2seq进行训练,对训练后的深度学习模型seq2seq进行对话测试;

对模型进行部署应用:根据训练后的深度学习模型seq2seq进行部署应用。

作为优选,对从开源获取到的聊天语料数据进行数据预处理具体如下:

结合语料实际情况和对话逻辑,对上下文语料中包含的特殊字符进行剔除;特殊字符包括表情、颜文字等字符;

对语料中上下文少于3个汉字的聊天语料进行删除;

分别训练语料中的上文模型和下文模型,筛选处聊天语料中词频大于5的token,保存上下文的词袋模型,以供深度学习模型使用。

作为优选,所述深度学习模型seq2seq包括Encoder架构和Decoder架构。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110094940.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top