[发明专利]基于结构化数据的主题树生成方法及系统及智能对话方法在审
申请号: | 201810103311.9 | 申请日: | 2018-02-01 |
公开(公告)号: | CN108363759A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 朱敬华;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤 | 申请(专利权)人: | 厦门快商通信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361007 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主题树 结构化数据 关联性 最大化 构建 热度 预设 智能 对话 知识库 决策树算法 对话数据 关联分析 训练语料 自动学习 数据库 分析 | ||
1.一种基于结构化数据的主题树生成方法,其特征在于,包括以下步骤:
a.获取结构化数据;
b.利用决策树算法进行计算所述结构化数据的根;
c.对所述根进行热度分析,并将热度大于预设值的根作为主题树的主题;
d.对所述根进行关联分析,并根据所述根的关联性选取最大化增益的属性值;
e.在所述最大化增益的属性值中,选取关联性大于预设值的属性值作为主题树的属性值;
f.由所述步骤c中的主题和所述步骤e中的属性值生成主题树。
2.根据权利要求1所述的一种基于结构化数据的主题树生成方法,其特征在于:所述的步骤a中,所述结构化数据包括以下一种以上:SQL数据库、二维形式表示的文本记录、二维形式表示的电子文档。
3.根据权利要求1所述的一种基于结构化数据的主题树生成方法,其特征在于:所述的步骤b中,是基于MapReduce机制对所述结构化数据进行解析,并获取所述结构化数据的<key,value>对,其中,key是指所述结构化数据的根,value是指所述结构化数据的属性值。
4.根据权利要求1所述的一种基于结构化数据的主题树生成方法,其特征在于:所述的步骤d中,所述关联分析是指采用Apriori算法或者FP-growth算法进行所述根的关联度的分析。
5.根据权利要求3所述的一种基于结构化数据的主题树生成方法,其特征在于:所述的步骤d中,选取最大化增益的属性值,是基于MapReduce机制计算所述结构化数据中包含的每个属性值的信息增益,选出其最大值作为所述结构化数据的根的分裂属性。
6.一种基于结构化数据的主题树生成系统,其特征在于,包括:
数据获取模块,用于获取结构化数据;
决策树聚类模块,其利用决策树算法进行计算所述结构化数据的根;
热度分析模块,用于对所述根进行热度分析,并将热度大于预设值的根作为主题树的主题;
关联分析模块,用于对所述根进行关联分析,并根据所述根的关联性选取最大化增益的属性值;并在所述最大化增益的属性值中,选取关联性大于预设值的属性值作为主题树的属性值;
主题树生成模块,其由所述热度分析模块中的主题和所述关联分析模块中的属性值生成主题树。
7.一种智能对话方法,其特征在于,包括权利要求1至5任一项所述的基于结构化数据的主题树生成方法;对话时,根据访客问题在所述主题树中进行匹配对应的主题,并根据该主题所对应的属性值,判断所述访客问题中是否存在未完成的属性值,若是,则基于该未完成的属性值对访客进行反向提问。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息技术有限公司,未经厦门快商通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810103311.9/1.html,转载请声明来源钻瓜专利网。