[发明专利]基于人工智能的意图识别方法、装置、设备及存储介质在审
申请号: | 202010162325.5 | 申请日: | 2020-03-10 |
公开(公告)号: | CN111428471A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 张智;江炼鑫;莫洋 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F40/284;G06F16/951;G06F16/332 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
地址: | 518033 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 意图 识别 方法 装置 设备 存储 介质 | ||
1.一种基于人工智能的意图识别方法,其特征在于,包括:
定时从预置论坛网站中采集初始数据;
根据预置业务对所述初始数据进行数据预处理,得到问题文本分句;
对所述问题文本分句按照被处理的先后顺序通过词频-逆文本频率指数算法计算夹角余弦值,并根据所述夹角余弦值确定目标答案;
通过深度神经网络文本分类模型对所述问题文本分句进行意图识别,得到模板类型;
根据所述模板类型对所述问题文本分句、所述目标答案和预置链接进行组合,并通过所述预置爬虫任务对拼接后的内容进行智能回帖,所述预置链接用于指示目标用户访问目标在线问答系统。
2.根据权利要求1所述的基于人工智能的意图识别方法,其特征在于,所述定时从预置论坛网站中采集初始数据,包括:
确定预置论坛网站的统一资源定位符地址;
通过预置爬虫任务和所述预置论坛网站的统一资源定位符地址定时访问所述预置论坛网站,得到网页数据;
对所述网页数据按照预置页面标识进行截取,得到初始数据,所述初始数据包括转义符、空格、网页标签和网页内容;
将所述初始数据与所述预置论坛网站的统一资源定位符地址记录到预置数据表中。
3.根据权利要求2所述的基于人工智能的意图识别方法,其特征在于,所述根据预置业务对所述初始数据进行数据预处理,得到问题文本分句,包括:
确定预置业务的关键词,并根据所述关键词对所述初始数据进行抽取;
通过文本处理方式对抽取后的数据删除所述转义符和所述空格,并对所述网页标签进行删除,得到文本数据;
对所述文本数据进行分句处理,并删除空字符串的分句,得到问题文本分句。
4.根据权利要求1所述的基于人工智能的意图识别方法,其特征在于,所述对所述问题文本语句按照被处理的先后顺序通过词频-逆文本频率指数算法计算夹角余弦值,并根据所述夹角余弦值确定目标答案,包括:
对所述问题文本分句按照被处理的先后顺序进行预处理,得到初始词汇表和第一问句向量;
根据词频-逆文本频率指数算法和所述初始词汇表对预置问句进行文本向量化,得到第二问句向量;
对所述第一问句向量和所述第二问句向量进行计算,得到夹角余弦值,并将所述夹角余弦值最大的预置问句对应的答案设置为目标答案。
5.根据权利要求4所述的基于人工智能的意图识别方法,其特征在于,所述对所述问题文本语句按照被处理的先后顺序进行预处理,得到初始词汇表和第一问句向量,包括:
将所述多个问题文本语句按照被处理的先后顺序写入到预置消息队列的队列尾部;
对所述问题文本分句设置超时时长,所述超时时长大于或者等于0;
当所述问题文本分句对应的超时时长等于0,并且所述问题文本分句仍处于等待状态时,将所述问题文本分句添加到延时任务队列中,所述延时任务队列用于处理超期的问题文本分句;
当所述问题文本分句对应的超时时长大于0时,对所述问题文本语句进行分词以及词性标注,得到初始词汇表和第一问句向量。
6.根据权利要求4所述的基于人工智能的意图识别方法,其特征在于,所述根据词频-逆文本频率指数算法和所述初始词汇表对预置问句进行文本向量化,得到第二问句向量,包括:
获取初始词汇表,所述初始词汇表中包括多个词汇αi,i为正整数;
从所述预置数据库中读取预置问句的数量N;
根据词频-逆文本频率指数算法统计所述多个词汇αi在所述问题文本分句中出现的次数m;
统计所述预置问句中包括所述多个词汇αi的问句数量n;
根据第一预置公式对所述预置问句进行文本向量化,得到第二问句向量,其中,所述第一预置公式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010162325.5/1.html,转载请声明来源钻瓜专利网。