[发明专利]智能服务水平训练方法、装置及计算机可读存储介质在审
申请号: | 201910752391.5 | 申请日: | 2019-08-14 |
公开(公告)号: | CN110647914A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 郭鸿程 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 44347 深圳市沃德知识产权代理事务所(普通合伙) | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提问问题 智能服务 数据训练 训练模型 构建 画像 计算机可读存储介质 标签 人工智能技术 网络行为记录 用户行为记录 预处理操作 答案 标准答案 服务水平 接收用户 训练装置 网络 智能 相似度 | ||
1.一种智能服务水平训练方法,其特征在于,所述方法包括:
接收用户的网络行为记录集和网络提问问题集,根据所述用户行为记录集得到用户画像,并将所述用户画像作为标签集,对所述网络提问问题集进行预处理操作后得到数据训练集;
通过所述标签集和数据训练集对预先构建的智能服务水平训练模型进行训练,得到训练值,将所述训练值和标签集输入至所述智能服务水平训练模型的损失函数中,计算出损失函数值,直至所述损失函数值小于阈值时,所述智能服务水平训练模型退出训练;
根据所述网络提问问题集和训练后的所述智能服务水平训练模型构建智能问答程序,利用所述智能问答程序对代理人提问问题,计算出所述代理人答案与标准答案的相似度,并对所述代理人答案进行打分以及给出建议。
2.如权利要求1所述的智能服务水平训练方法,其特征在于,所述预处理操作包括:
对所述网络提问问题集进行文本改写;
其中,所述文本改写包括分词处理和关键词提取,其中:
所述分词处理包括:
利用全切分法对所述网络提问问题集进行切分,获取多种分词方式;
通过马尔可夫模型计算出每一种分词方式的概率,选择概率最大的一种分词方式中的分词结果,作为所述网络提问问题集的分词结果。
所述关键词提取包括:
计算所述分词结果中的任意两个词语Wi和Wj的依存关联度:
其中,len(Wi,Wj)表示词语Wi和Wj之间的依存路径长度,b是超参数;
计算词语Wi和Wj的引力:
其中,tfidf(W)是词语W的TF-IDF值,TF表示词频,IDF表示逆文档频率指数,d是词语Wi和Wj的词向量之间的欧式距离;
得到词语Wi和Wj之间的关联度为:
weight(Wi,Wj)=Dep(Wi,Wj)*fgrav(Wi,Wj)
建立无向图G=(V,E),其中V是顶点的集合,E是边的集合;
计算出词语Wi的重要度得分:
其中,是与顶点Wi有关的集合,η为阻尼系数;
根据所述重要度得分,对所有词语进行排序,根据所述排序从所述词语中选择预设数量的关键词作为主干词,并对所述主干词进行语义增强,得到改写后的文本。
3.如权利要求2所述的智能服务水平训练方法,其特征在于,所述预处理操作还包括:
通过欧式公式计算出所述改写后的文本中数据对象之间的距离,根据聚类算法预设n个类簇,其中,第k个类簇的类簇中心为Centerk,计算出所述改写后的文本中的每一个数据到所述n个类簇中的每一个类簇中心的距离,并得到所述每一个数据在所述每一个类簇中心的特征;
利用分类器对所述特征进行训练,计算出所述每一个数据在所述类簇中心的概率大小,并通过误差平方和准则函数得到所述改写后的文本中每一个数据在类簇中心的聚类结果,从而对所述改写后的文本进行分群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910752391.5/1.html,转载请声明来源钻瓜专利网。