[发明专利]机器人知识库的建设方法及建设系统在审
申请号: | 201711172532.3 | 申请日: | 2017-11-22 |
公开(公告)号: | CN109947908A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 李波;程洁;姜中秋;姚贡之;曾永梅;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/22;G06F16/21 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识点 知识库 自动问答 二维表 属性信息 机器人 建设 属性信息存储 人员工作量 答案 自动生成 表体 表头 题目 | ||
本发明实施例公开了一种机器人知识库的建设方法及建设系统,所述建设方法包括:获取静态二维表数据;从表头中确定所述表体对应的两个以上属性信息;根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;将所述静态二维表数据、所述自动问答知识点及所述属性信息存储到知识库中。本发明实施例实现了根据静态二维表数据自动生成知识点,并建立对应的知识库,减少了操作人员工作量并减少了人为犯错的可能,提高了生成的知识点的准确性和生成效率。
技术领域
本发明实施例涉及自动问答技术,尤其涉及一种机器人知识库的建设方法、机器人知识库、自动问答方法、自动问答系统、机器人知识库的建设系统、终端设备以及计算机存储介质。
背景技术
在自动问答系统中,有一些知识点不是从简单的自动问答对而来,而是来自于一些静态二维表结构实现的结构化数据,结构化数据的数据量很庞大,如表1所示的理财表对应着约8*5条知识点(如增利系列九十天的年利率是多少),知识点包括问题和答案,知识量很大,而且每条知识点都需要操作人员手动整理。
表1理财表
如果表中内容一旦大批量修改,操作人员就需要找到对应的知识点的答案一一做变更,不但工作量大,而且容易出差错。
发明内容
有鉴于此,本发明实施例提供一种机器人知识库的建设方法、机器人知识库、自动问答方法、自动问答系统、机器人知识库的建设系统、终端设备以及计算机存储介质,以实现自动生成知识点,减少操作人员工作量并提高知识点的准确性。
本发明实施例提供了一种机器人知识库的建设方法,包括:
获取静态二维表数据,所述静态二维表数据包括题目、表头和表体,所述表头为第一行,所述表体为第一行之外的其它行;
从表头中确定所述表体对应的两个以上属性信息,当多列数据的表头内容对应的属性相同时,将所述多列数据的表头内容归纳为一个所述属性信息,当仅一列数据的表头内容对应一个属性时,直接将该列数据的表头内容作为一个所述属性信息;
根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;
将所述静态二维表数据、所述自动问答知识点及所述属性信息存储到知识库中。
可选地,所述方法还包括:
建立所述属性信息与对应的表体中内容或表头内容的包含关系;
将所述包含关系存储到知识库中。
可选地,所述方法还包括:
为所述表头或/和所述表体中的词语建立词类,所述词语作为对应词类的词类名,所述词类包括所述词语以及所述词语的同义词;
建立所述属性信息与对应的表体中内容的包含关系包括:建立所述属性信息与对应的表体或表头中词类名的包含关系;
将所述包含关系存储到知识库中还包括:将所述词类存储到知识库中。
可选地,根据所述属性信息生成一个或多个自动问答知识点包括:
根据至少两个所述属性信息自动生成一个初始知识点;
对每个所述初始知识点进行调整,得到所述自动问答知识点。
本发明实施例还提供了一种采用上述的机器人知识库的建设方法建设的机器人知识库。
本发明实施例还提供了一种基于上述机器人知识库的自动问答方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711172532.3/2.html,转载请声明来源钻瓜专利网。