[发明专利]一种基于知识图谱的文学编年史问答系统的构建方法有效
申请号: | 201811455685.3 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109766417B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 吴江琴;黄诗磊;庄越挺 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于知识图谱的文学编年史问答系统的构建方法:以中国文学编年史相关的结构化数据为基础,结合自上而下创建的文学编年史本体结构,构建了文学编年史垂直领域的知识图谱;设计了语义解析框架,包含了两种用户问题解析的模块,一个是基于正则与规则,一个是基于神经网络;将问题解析得到的结果组织成对应的SPARQL查询语句,在构建的知识图谱中搜索对应的结果;将结果组织为回复,返回给用户;设计实现了网页端和微信公众号服务,作为系统与用户交互的窗口;设计实现了用户使用日志与反馈收集模块,将相关数据用于迭代训练神经网络模型,增强模型的泛化能力;本发明可以直接处理用户的自然语言查询,返回精准的结果,对提升知识获取效率、促进中国文化研究等方面均有重要作用。 | ||
搜索关键词: | 一种 基于 知识 图谱 文学 编年史 问答 系统 构建 方法 | ||
【主权项】:
1.一种基于知识图谱的文学编年史问答系统的构建方法,其特征在于包括如下步骤:1)预处理数据:设计关系型数据库ER图,获取文学编年史相关的结构化数据,转存数据于自定义schema数据库中;2)本体建模:根据文学编年史涉及的概念、实体,自上而下构建垂直领域的本体结构;3)数据格式转换:利用创建的本体,创建映射文件;将关系型数据库中的结构化数据转为RDF格式;4)数据存储及查询服务:利用第三方开源软件存储RDF数据,并启用SPARQL查询终端提供接口;5)语义解析:通过基于正则与规则的方法对用户查询进行语义解析,若解析失败,则采用基于神经网络的方法解析用户查询;6)SPARQL查询:根据语义解析的结果构建SPARQL查询,对知识图谱进行搜索得到相应结果返回用户;7)日志反馈收集:收集用户使用日志和用户反馈用于定位失败的案例,改进系统功能;将日志作为标注数据,迭代训练神经网络模型,提升泛化性能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811455685.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源政策信息抽取方法及系统
- 下一篇:用于输出信息的方法和装置