[发明专利]一种智能问答数据处理方法及装置在审
申请号: | 201810686605.9 | 申请日: | 2018-06-28 |
公开(公告)号: | CN108984658A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 张望舒;王全剑;段希娜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务信息 提问信息 数据处理 提问内容 业务标签 用户提问 智能 标签数据库 应答信息 准确定位 匹配 引入 | ||
1.一种智能问答数据处理方法,包括:
接收提问信息,所述提问信息包括:提问内容信息、业务信息;
将所述业务信息与建立的标签数据库进行匹配,获取所述业务信息对应的业务标签;
根据所述业务标签和所述提问内容信息,确定出所述提问信息对应的应答信息。
2.如权利要求1所述的方法,所述方法还包括:
获取所述提问内容信息对应的知识点信息;
将所述知识点信息与所述标签数据库进行匹配,获取所述知识点信息对应的内容标签;
相应地,所述根据所述业务标签和所述提问内容信息,确定出所述提问信息对应的应答信息,包括:
将所述内容标签与所述业务标签进行匹配,获取满足预设要求的内容标签对应的筛选知识点信息;
根据所述提问内容信息、所述筛选知识点信息,确定出所述提问信息对应的应答信息。
3.如权利要求2所述的方法,所述根据所述提问内容信息、所述筛选知识点信息,确定出所述提问信息对应的应答信息,包括:
分别确定所述筛选知识点信息和所述提问内容信息之间的相关性;
将相关性满足预设相关性条件的知识点信息作为目标知识点信息;
根据所述目标知识点信息、所述提问内容信息,确定所述提问信息对应的应答信息。
4.如权利要求3所述的方法,所述方法还包括:
若所述筛选知识点信息均不满足所述预设相关性条件,则分别获取所述提问内容信息对应的所有知识点信息与所述提问内容信息之间的相关性,选择相关性满足所述预设相关性条件的知识点信息作为目标知识点信息;
根据所述目标知识点信息、所述提问内容信息,确定所述提问信息对应的应答信息。
5.如权利要求1所述的方法,所述标签数据库采用层次聚类法进行建立。
6.如权利要求5所述的方法,在利用层次聚类法建立所述标签数据库时,所述方法还包括:
利用提问信息样本的文本相似度特征的加权平均值计算所述提问信息样本之间的距离,所述文本相似度特征包括:语句间杰卡德距离、句向量距离、词向量距离。
7.如权利要求1所述的方法,所述将所述业务信息与建立的标签数据库进行匹配,获取所述业务信息对应的业务标签,包括:
判断所述业务信息是否是交易业务信息,若是,则提取所述交易业务信息对应的交易因子信息,所述交易因子信息包括:交易对象标识、交易类型、交易商品名称;
利用所述标签数据库,基于交易对象标识与业务标签之间的映射关系,获取所述交易因子信息中的交易对象标识对应的交易对象标签;
和/或,利用所述标签数据库,基于交易类型与业务标签之间的映射关系,获取所述交易因子信息中的交易类型对应的类型标签;
和/或,利用所述标签数据库,基于运营规则与业务标签之间的映射关系,获取所述交易因子信息中的交易商品对应的商品标签;
根据所述交易对象标签、所述类型标签、所述商品标签中的至少一种确定所述交易业务信息对应的业务标签。
8.如权利要求1-7任一项所述的方法,所述业务信息的获取方法包括:
获取客户端的设备监测信息;
根据所述设备检测信息,获取所述客户端对应的用户的行为轨迹;
根据所述行为轨迹获取所述业务信息。
9.一种智能问答数据处理装置,包括:
提问信息获取模块,用于接收提问信息,所述提问信息包括:提问内容信息、业务信息;
业务标签获取模块,用于将所述业务信息与建立的标签数据库进行匹配,获取所述业务信息对应的业务标签;
应答信息确定模块,用于根据所述业务标签和所述提问内容信息,确定出所述提问信息对应的应答信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810686605.9/1.html,转载请声明来源钻瓜专利网。