[发明专利]智能助理的语料构建方法、装置、计算机设备和存储介质在审
申请号: | 201911158765.7 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110955765A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 林志达;吴石松;吴丹 | 申请(专利权)人: | 中国南方电网有限责任公司;南方电网数字电网研究院有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 刘艳丽 |
地址: | 510623 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 助理 语料 构建 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种智能助理的语料构建方法、装置、计算机设备和存储介质。所述方法包括:从待构建语料的智能助理对应的电力运营管理系统的系统日志中提取当前问答文本数据;对当前问答文本数据进行文本向量化操作,得到当前问答文本向量;将当前问答文本向量输入到语料构建模型,语料构建模型根据从系统日志中提取的问答文本数据训练得到;根据语料构建模型的输出结果获得问题文本和答案文本,将得到的问题文本和答案文本关联,关联后的问题文本和答案文本作为智能助理的问答语料数据。采用本方法能够缩短智能助理的语料库构建的周期并提升所构建的问答语料数据与应用场景的适用性。
技术领域
本申请涉及电力技术领域,特别是涉及一种智能助理的语料构建方法、装置、计算机设备和存储介质。
背景技术
随着电力行业以及人工智能技术的快速发展,越来越多的电力业务开始使用智能助理(例如,也称为“智能对话助手”,或简称为“助理”)。用户可以基于计算机设备提供的用户接口与智能助理进行聊天、说话或以其他方式的交互以使智能助理响应用户的需求输出相应信息,或以其他方式执行某些操作。智能助理的实现逻辑与聊天机器人相似,但是多了业务处理的流程,智能助理会根据对话管理返回的结果进行相关业务的处理。
智能助理作为人工智能领域的一个重要分支,得到了越来越广泛的关注和应用。智能助理通过自然语言理解和问答系统与用户进行交互,其中,原始语料库的采集和构建对于智能助理的响应准确度和功能涵盖程度都是至关重要的。目前的智能助理语料数据主要以人工采集标注或基于模板的方式进行构建,不但构建语料库的周期较长,而且也较难适用于相应的应用场景。
发明内容
基于此,有必要针对上述技术问题,提供一种能够缩短智能助理的语料库构建的周期并提升与应用场景的适用性的智能助理的语料构建方法、装置、计算机设备和存储介质。
一种智能助理的语料构建方法,该方法包括:
从待构建语料的智能助理对应的电力运营管理系统的系统日志中提取当前问答文本数据;
对当前问答文本数据进行文本向量化操作,得到当前问答文本向量;
将当前问答文本向量输入到语料构建模型,语料构建模型根据从系统日志中提取的问答文本数据训练得到;
根据语料构建模型的输出结果获得问题文本和答案文本,将得到的问题文本和答案文本关联,关联后的问题文本和答案文本作为智能助理的问答语料数据。
在其中一个实施例中,上述的语料构建模型的训练过程包括:
从系统日志中提取问答文本数据,从问答文本数据中划分出训练样本集,训练样本集包括多个第一问答文本数据;
将多个第一问答文本数据进行文本向量化操作,得到第一问答文本向量;
构建对抗网络,对抗网络包括生成器模型和判别器模型;生成器模型用于根据第一问答文本向量生成第一问题文本向量以及第一问答文本向量对应的第一答案文本向量;判别器模型用于对第一问答文本以及第一答案文本向量的真实性进行判别;
进行基于生成对抗网络的训练,得到语料构建模型。
在其中一个实施例中,上述的进行基于生成对抗网络的训练,得到语料构建模型,包括:
获取默认真实样本集,默认真实样本集包括默认真实问题文本和默认真实问题文本对应的默认真实答案文本;
将默认真实问题文本和默认真实答案文本进行文本向量化操作,得到第二问题文本向量和第二问题文本向量对应的第二答案文本向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司;南方电网数字电网研究院有限公司,未经中国南方电网有限责任公司;南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911158765.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理风化型黑白钨矿的选矿工艺方法
- 下一篇:一种避免倾倒的油冷机