[发明专利]一种基于在线聊天记录的表单生成方法和系统在审
申请号: | 201711146457.3 | 申请日: | 2017-11-17 |
公开(公告)号: | CN109800410A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 刘昊骋 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/24;H04M3/53;G06N3/04;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聊天记录 表单项 向量化 在线聊天记录 映射模型 自动生成 有效地 客服 省时 映射 省力 客户 申请 | ||
1.一种基于聊天记录的表单生成方法,如其特征在于,包括:
获取客户与客服之间的聊天记录;
对所述聊天记录进行向量化;
利用表单映射模型,将各向量化结果映射至表单项;
根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。
2.根据权利要求1所述的方法,其特征在于,所述获取客户与客服之间的聊天记录包括:
对语音聊天记录中进行转换得到聊天文本信息;或,
从文字聊天记录中抽取出聊天文本信息。
3.根据权利要求1所述的方法,其特征在于,对所述聊天记录进行向量化包括:
对聊天记录中聊天文本信息进行分词处理和词频统计,将聊天文本信息中的各文本单位转化成词频表示的向量。
4.根据权利要求3所述的方法,其特征在于,利用表单映射模型,将各向量化结果映射至表单项包括:
将各文本单位转化成的词频表示的向量输入至表单映射模型,获取表单映射模型输出的表单项。
5.根据权利要求4所述的方法,其特征在于,根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单包括:
利用聊天记录中的各文本单元对其对应的表单项进行填充,生成基于聊天记录的表单。
6.根据权利要求1所述的方法,其特征在于,所述表单映射模型采用以下方式预先训练得到:
选取训练样本,所述训练样本包括:聊天文本信息的各文本单元、对应的表单项;
将各文本单元的向量化结果作为原始深层神经网络的输入,对应的表单项作为所述原始深层神经网络的输出,训练所述原始深层神经网络,得到所述表单映射模型。
7.一种基于聊天记录的表单生成系统,其特征在于,包括:
获取模块,用于获取客户与客服之间的聊天记录;
向量化模块,用于对所述聊天记录进行向量化;
表单映射模块,用于利用表单映射模型,将各向量化结果映射至表单项;
表单生成模块,用于根据所述聊天记录以及对应的表单项,生成基于聊天记录的表单。
8.根据权利要求7所述的系统,其特征在于,所述获取模块具体用于:
对语音聊天记录中进行转换得到聊天文本信息;或,
从文字聊天记录中抽取出聊天文本信息。
9.根据权利要求7所述的系统,其特征在于,所述向量化模块具体用于:
对聊天记录中聊天文本信息进行分词处理和词频统计,将聊天文本信息中的各文本单位转化成词频表示的向量。
10.根据权利要求9所述的系统,其特征在于,所述表单映射模块具体用于:
将各文本单位转化成的词频表示的向量输入至表单映射模型,获取表单映射模型输出的表单项。
11.根据权利要求10所述的系统,其特征在于,所述表单生成模块,具体用于:
利用聊天记录中的各文本单元对其对应的表单项进行填充,生成基于聊天记录的表单。
12.根据权利要求7所述的系统,其特征在于,所述系统还包括
表单映射模型训练模块,用于,
聊天文本信息的各文本单元、对应的表单项;
将各文本单元的向量化结果作为原始深层神经网络的输入,对应的表单项作为所述原始深层神经网络的输出,训练所述原始深层神经网络,得到所述表单映射模型。
13.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~6中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711146457.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中文分词方法及系统
- 下一篇:临床医疗实体及其属性抽取方法