[发明专利]一种基于时间轴的历史题解题方法、系统及介质有效
申请号: | 201710888726.7 | 申请日: | 2017-09-27 |
公开(公告)号: | CN107679154B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 陈清财;潘囿丞;王晓龙;郑志辉;刘乐 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/31;G06F16/35;G06N5/02 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时间 历史 题解 方法 系统 介质 | ||
1.一种基于时间轴的历史题解题方法,其特征在于,包括如下步骤:
时间轴知识库构建步骤:从历史知识库筛选出包含时间属性的词条,并按照时间轴顺序进行组织,构建一个基于时间轴的知识库;
历史词条时间字典构建步骤:利用现有时间轴知识库,对常见的含有时间属性的历史词条,构建其对应的时间字典,每一个词条都有对应的时间属性,常见的含有时间属性的历史词条是工作人员从时间轴知识库中筛选出来的;
问题时间属性分析步骤:对历史简答题的时间属性进行分析,将问题分类为时间限定类和非时间限定类;
相关词条筛选步骤:在时间轴知识库中筛选出与问题相关度最高的前n条历史词条作为候选答案的出处;
基于时间轴的文档片段筛选步骤:该步骤针对那些有时间信息的时间限定类问题,在得到n条相关的历史词条后,对每一个词条中的内容进行筛选留下与问题时间相关的内容;
候选答案生成步骤:通过计算问题与文档片段的相似度,选择得分最高的片段作为问题的候选答案。
2.根据权利要求1所述的历史题解题方法,其特征在于,在时间轴知识库构建步骤中,对时间轴知识库的构建包括如下步骤:
历史知识库词条筛选步骤:对历史知识库中的词条利用分类器进行筛选,保留其中与历史相关的词条;
历史词条时间信息获取步骤:对历史知识库中的历史词条,利用分类器和规则得到每个词条内容中的时间信息,并进行统一化处理,最终选择合适的时间段或时间点作为该词条的时间信息;
时间轴知识库词条筛选步骤:利用历史知识库中词条得到的时间信息对词条进行筛选,保留包含时间信息的历史词条;
时间轴知识库组织步骤:将有时间属性的历史词条,按照相应的时间先后顺序进行组织,构成一个时间轴知识库,其中所有词条都遵循时间顺序。
3.根据权利要求2所述的历史题解题方法,其特征在于,在所述历史知识库词条筛选步骤中,包括如下步骤:
获取百度百科词条步骤:使用网络爬虫爬取百度百科词条,并解析网页内容保存为xml文件;
获取维基百科词条步骤:使用网络爬虫爬取维基百科词条,并解析网页内容保存为xml文件;
分类历史相关词条步骤:利用分类器对百度百科和维基百科中的词条进行分类,得到历史相关的词条进行保留;
在所述历史词条时间信息获取步骤中,包括如下步骤:
历史词条时间信息抽取步骤:使用分类器和规则相结合的方法抽取历史词条中与该词条相关的时间信息;
历史词条时间信息统一化步骤:对历史词条中获取的不同形式的时间信息进行统一化处理;
历史词条时间信息选择步骤:对一个历史词条中可能存在的多个时间信息进行筛选,赋予该词条时间点属性或时间段属性。
4.根据权利要求1所述的历史题解题方法,其特征在于,在所述历史词条时间字典构建步骤中,包括如下步骤:
历史词条选择步骤:对时间轴知识库中的所有历史词条进行人工的筛选,选择常见的、包含时间的历史事件、历史朝代词条;
时间字典构建步骤:对选择的历史词条,构建一个词条名和时间段或时间点相对应的字典。
5.根据权利要求1所述的历史题解题方法,其特征在于,在所述问题时间属性分析步骤中,对已历史简答题问题进行分析包括如下步骤:
显式时间信息查找步骤:用规则查找历史简答题的问题中是否包含显式的时间信息,若包含,则将题目归类为时间限定类,并提取出时间表达式;
隐式时间信息查找步骤:若用规则没有查找到问题中包含显示的时间表达式,则利用历史词条时间字典对问题进行查找,判断问题中是否包含隐式的时间表达式;
时间信息判断步骤:对于题目中包含显式时间表达式或隐式时间表达式的题目分类为时间限定类问题和非时间限定类问题;
问题时间表达式统一步骤:对于时间限定类问题中的时间表达式进行格式化处理,统一成和时间轴中时间表达一致的形式;
在所述问题时间表达式统一步骤中,包括如下步骤:
显式时间表达式统一步骤:针对问题中显式的时间表达式,进行格式的统一;
隐式时间表达式统一步骤:针对问题中隐式的时间表达式,利用历史词条时间字典中词条对应的时间作为问题的时间,对问题的时间进行统一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710888726.7/1.html,转载请声明来源钻瓜专利网。