[发明专利]基于人工智能的针对多轮对话进行语义分析的方法和装置在审
申请号: | 202110735380.3 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113486674A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 欧香强;王爱丽;李志豪 | 申请(专利权)人: | 河南光悦网络科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/289;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450000 河南省郑州市自贸试验区*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 针对 轮对 进行 语义 分析 方法 装置 | ||
本发明涉及一种基于人工智能的针对多轮对话进行语义分析的方法和装置,获取样本多轮对话数据,对各样本语句进行分词处理,得到各样本语句中的各个样本词语,得到各样本语句的句向量,将当前样本语句的句向量与各历史样本语句的句向量分别进行组合,得到句向量集合,并对句向量集合进行向量编码,得到上下文编码向量,根据上下文编码向量构建语义分析训练集,根据语义分析训练集,对语义分析模型进行训练,根据训练得到的语义分析模型进行语义分析。利用样本多轮对话数据中的当前样本语句和历史样本语句,即结合多轮对话数据中的上下文信息进行语义识别,相较于只对当前一轮对话中的语句进行语义分析,语义分析的准确性得到很大的提升。
技术领域
本发明涉及一种基于人工智能的针对多轮对话进行语义分析的方法和装置。
背景技术
在与智能机器人进行人机交互时,通常需要与智能机器人进行多轮对话,智能机器人根据多轮对话进行语义分析时,通常只对当前一轮对话中的语句进行语义分析,由于各轮对话之间通常存在很密切的关联,因此,这种语义分析方法的准确性较低。
发明内容
本发明提供一种基于人工智能的针对多轮对话进行语义分析的方法和装置,用于解决现有的针对多轮对话进行语义分析的方法的准确性较低的技术问题。
一种基于人工智能的针对多轮对话进行语义分析的方法,包括:
获取样本多轮对话数据,所述样本多轮对话数据中的各样本语句包括当前样本语句和至少一个历史样本语句;
基于预设的词语数据库,对各样本语句进行分词处理,得到各样本语句中的各个样本词语;
根据各样本语句中的各个样本词语,得到各样本语句的句向量;
将所述当前样本语句的句向量与各历史样本语句的句向量分别进行组合,得到句向量集合,并对所述句向量集合进行向量编码,得到上下文编码向量;
构建语义分析训练集,所述语义分析训练集包括所述上下文编码向量,并根据所述语义分析训练集,对语义分析模型进行训练;
根据训练得到的语义分析模型进行语义分析。
优选地,所述基于预设的词语数据库,对各样本语句进行分词处理,得到各样本语句中的各个样本词语,具体为:
对于任意一个样本语句,将该样本语句输入至所述词语数据库中,获取该样本语句中存在于所述词语数据库中的各个词语,得到的各个词语为该样本语句中的各个样本词语。
优选地,所述将该样本语句输入至所述词语数据库中,获取该样本语句中存在于所述词语数据库中的各个词语,得到的各个词语为该样本语句中的各个样本词语,具体为:
将该样本语句输入至所述词语数据库中,获取该样本语句中存在于所述词语数据库中的各个初始词语;
获取各个初始词语在所述样本多轮对话数据中出现的次数;
根据预设次数阈值,获取所述各个初始词语中的出现次数大于或者等于所述预设次数阈值的初始词语,获取得到的初始词语为该样本语句中的样本词语。
优选地,所述根据各样本语句中的各个样本词语,得到各样本语句的句向量,具体为:
对于任意一个样本语句,将该样本语句中的各个样本词语进行向量转换,得到对应的词向量;
根据各个样本词语对应的词向量,以及各个样本词语在该样本语句中的顺序,对各个样本词语对应的词向量进行排序,得到词向量序列;
对所述词向量序列进行向量转换,得到该样本语句的句向量。
优选地,所述将该样本语句中的各个样本词语进行向量转换,得到对应的词向量,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南光悦网络科技有限公司,未经河南光悦网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110735380.3/2.html,转载请声明来源钻瓜专利网。