[发明专利]语句所记述事件的发生时间推定方法、设备及存储介质有效
申请号: | 201710370231.5 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107329948B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 姬晨 | 申请(专利权)人: | 南京风数智能科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/279;G06F40/258 |
代理公司: | 北京华识知识产权代理有限公司 11530 | 代理人: | 乔浩刚 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 记述 事件 发生 时间 推定 方法 设备 存储 介质 | ||
本发明公开了一种语句所记述事件的发生时间推定方法、设备及存储介质,通过获取文本中包含时间信息的时间语句并分类,计算各类别的第一特征向量,同时计算待推语句的第二特征向量,将第二特征向量与各第一特征向量进行匹配,根据匹配结果确定待推语句所记述事件的发生时间。这样,通过将语句进行数字化,就使得文本中不含有时间信息的待推语句可以通过数字化之后的向量匹配找到文本中内容最接近的时间语句,从而根据该时间语句推定该待推语句所记述的事件的发生时间。这就使得在对文本生成摘要的过程中,可以很大程度上避免对文本的关键信息造成的损失,保证摘要对文本关键信息提取的完整性。
技术领域
本发明涉及信息技术领域,更具体地说,涉及一种语句所记述事件的发生时间推定方法、设备及存储介质。
背景技术
随着社会的不断发展,人们日常生活中的信息交互也愈加频繁。文本,作为人们日常生活中一种重要的交互工具,其通过文字将信息传递给他人。在通过文本进行信息交互时,由于文本本身可能携带的大量信息,为便于其他人选择是否阅读,往往需要对文本进行归纳生成摘要。对于大多数文本而言,摘要需要体现出文本语句所记述的事件及其发生时间,尤其是对新闻等对于时间需求极为敏锐的文本而言,在摘要中准确体现出事件的发生时间极为关键。而在当前生成摘要的过程中,其采用的方式是抽取文本中含有时间信息的语句,过滤掉那些不含时间信息的语句,从而组成摘要。而在实际情况中,文本中不含时间信息的语句占大多数,而某些不含时间信息的语句中往往包含有重大信息。因此,简单的过滤掉那些不含时间信息的语句,而单纯采用含有时间信息的语句构成文本的摘要,在很大概率上会损失文本的关键信息,从而严重影响用户对该文本是否阅读的判断,因此,急需提出一种可以对文本语句所记述事件的发生时间进行推定的方法。
发明内容
本发明要解决的技术问题在于:在当前生成摘要的过程中,是简单的过滤掉那些不含时间信息的语句,而单纯采用含有时间信息的语句构成文本的摘要,这会在很大概率上会损失文本的关键信息,从而严重影响用户对该文本是否阅读的判断,用户体验差。针对该技术问题,本发明提供了一种语句所记述事件的发生时间推定方法、设备及存储介质。
为解决上述技术问题,本发明提供一种语句所记述事件的发生时间推定方法,所述语句所记述事件的发生时间推定方法包括:
获取文本中包含时间信息的语句作为时间语句,所述文本为需要推定时间的待推语句所在的文本;
根据所述时间信息对各所述时间语句进行分类,并基于各类别中的时间语句计算属于该类别的第一特征向量,所述第一特征向量为各所述类别中时间语句的数字化表征向量;
计算所述文本中需要推定时间的待推语句的第二特征向量,所述第二特征向量为所述待推语句的数字化表征向量;
将所述第二特征向量与各所述第一特征向量进行匹配,并根据匹配结果确定所述待推语句所记述事件的发生时间。
进一步地,所述获取文本中包含时间信息的语句作为时间语句包括:
获取包含明确时间信息的第一时间语句;
和/或,
获取包含时间推定信息的第二时间语句。
进一步地,所述根据所述时间信息对各所述时间语句进行分类包括:
针对获取到的所述第一时间语句:
根据各所述第一时间语句所包含的明确时间信息对各所述第一时间语句进行分类;
针对获取到的所述第二时间语句:
基于所述文本的发表时间或该第二时间语句的前一时间语句对应的时间,根据所述第二时间语句所包含的所述时间推定信息推定所述第二时间语句对应的时间;
根据所述第二时间语句对应的时间,对各所述第二时间语句进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风数智能科技有限公司,未经南京风数智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710370231.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:燃气轮机发电机组的鲁棒自适应控制器
- 下一篇:一种语义匹配方法和系统